标签: wps电脑版的下载入口的方法

  • wps电脑版的下载的入口怎么找

      按照普通的mean来求菜品的均价无法计算(中间可能会有重复的菜品);

      但按照类别对菜品进行分类获取的菜品是唯一的,这就用到了astype()方法并配合category(类别)来完成

      普通求法:

      在这里插入图片描述

      获得的count会有重复,这就会用到astype

      在这里插入图片描述

      在这里插入图片描述

      将本身的数据类型转换成符合条件的时间日期型,方便数据操作

      在这里插入图片描述

      序列的.dt方法其实就是datatime方法的转换

      在这里插入图片描述

      (1)groupby()方法

      groupby参数:

      在这里插入图片描述

      分组获取指定列对象

      在这里插入图片描述

      获取的是DataFrameGroupBy 对象

      但对于DataFrameGroupBy取出的就是SeriesGroupBy对象

      我们可以对分组后的对象进行一些操作:如均值

      在这里插入图片描述

      亦可以对分组后的对象进行一些聚合操作

      在这里插入图片描述

      说明:可以进行分组,分组后的所有列只能使用一种聚合函数操作

      注意:如果想让不同的列进行不同的聚合操作,需要写两次代码

      (1)agg()方法

      agg,aggregate 方法都支持对每个分组应用某函数,包括 Python 内置函数或自定义函数。 同时这两个方法能够也能够直接对 DataFrame 进行函数应用操作。在正常使用过程中,agg 函数和 aggregate 函数对 DataFrame 对象操作时功能几乎完全相 同,因此只需要掌握其中一个函数即可。它们的参数说明如下表

      在这里插入图片描述

      以我们之前的所学无法求不同列的均值,和等聚合操作;但利用agg方法我们可以来做个尝试

      求不同列的和

      在这里插入图片描述

      说明:agg函数解决了让不同的列可以进行不同的聚合操作

      ① 使用方法1

      对counts和amounts进行均值、求和操作

       WPS office电脑版的下载地址在哪里在这里插入图片描述

      ② 使用方法2

      对counts进行求和操作,对amounts进行均值操作

      wps官网的下载方法是什么在这里插入图片描述

      ③ 使用方法3

      对一个列进行多个聚合操作,

      在这里插入图片描述

      ④ 使用方法4

      实现将自定义函数作为聚合函数统计函数

      在这里插入图片描述

      (2)在分组的基础上进行聚合操作
    wps电脑版的下载入口的方法
      即DataFrameGroupBy.聚合操作

      在这里插入图片描述

      (3)apply()方法wps官网最新的下载的方法是什么

      注意:agg与apply的区别:

      主要区别在于

      apply是对整个表格中的数据进行聚合操作而agg方法可以让不同的字段应用不同的聚合函数

      相同之处就是:

      都可以对分组后的数据进行聚合操作

      在这里插入图片描述

      apply仅支持对某些列或所有数据进行聚合操作,但满足不了不同的列应用不同的聚合操作

      在这里插入图片描述

      因为参数是func,亦可以完成多个聚合操作

      在这里插入图片描述

      在分组后也可以使用apply进行聚合操作

      在这里插入图片描述

      (4)transform()方法

      transform 方法能够对整个 DataFrame 的所有元素进行操作。且 transform 方法只有一个 参数“func”,表示对 DataFrame 操作的函数。同时 transform 方法还能够对 DataFrame 分组后的对象 GroupBy 进行操作,可以实现组 内离差标准化等操作。若在计算离差标准化的时候结果中有 NaN,这是由于根据离差标准化公式,最大值和 最小值相同的情况下分母是 0。而分母为 0 的数在 Python 中表示为 NaN。

      func表名可以传入函数对其聚合操作,自定义函数进行离差标准化操作

       wps的官网的下载地址在哪里在这里插入图片描述

      ① 对于离差标准化

      agg/apply/transform都可以用来做离差标准化;因为参数中都有func,都可以自定义函数

      在这里插入图片描述

      注意:不能用分组后的数据来进行离差标准化;分组后取counts是一组一组的,不是一个一个的数据

      通过离差标准化可以计算方差或标准差

      衡量数据离散程度可以使用方差或标准差

      在这里插入图片描述

      不使用离差标准化会因为单位不同等原因造成方差的结果很大,对实际不符

      利用 pivot_table 函数可以实现透视表,pivot_table()函数的常用参数及其使用格式如下

      在这里插入图片描述

      pivot_table自带聚合函数mean操作(默认的)在不特殊指定聚合函数 aggfunc 时,会默认使用 numpy.mean 进行聚合运算,numpy.mean 会自动过滤掉非数值类型数据。可以通过指定 aggfunc 参数修改聚合函数。index相当于分组;如下面对order_id分组;和 groupby 方法分组的时候相同,pivot_table 函数在创建透视表的时候分组键 index 可 以有多个通过设置 columns 参数可以指定列分组当全部数据列数很多时,若只想要显示某列,可以通过指定 values 参数来实现。当某些数据不存在时,会自动填充 NaN,因此可以指定 fill_value 参数,表示当存在缺 失值时,以指定数值进行填充可以更改 margins 参数,查看汇总数据。

      在这里插入图片描述

      按order_id分组,并求均值

      如果想要指定聚合函数aggfunc=’'

      aggfunc=’'内置是字符串可以直接写聚合函数,但最好用numpy.方法;可以提示,防止写错

      在这里插入图片描述

      交叉表是一种特殊的透视表,主要用于计算分组频率。利用 pandas 提供的 crosstab 函数 可以制作交叉表,crosstab 函数的常用参数和使用格式如下

      在这里插入图片描述

      由于交叉表是透视表的一种,其参数基本保持一致,不同之处在于 crosstab 函数中的 index,columns,values 填入的都是对应的从 Dataframe 中取出的某一列。

      交叉表和透视表的index区别:交叉表index不能直接跟字段名‘order_id’,跟的是字段值detail[‘order_id’]

      在这里插入图片描述

      columns为对应列的所有数据作为交叉表的列,values是对应数量放在对应列下,aggfunc=numpy.sum是把分组order_id的所有内容加到一行

      在这里插入图片描述

      注意:drop_duplicates默认是对这一行的所有数据进行比对,完全一样才会骑去重;我们可以通过subset=[’’,’’]来指定几个字段去重

      inplace=False有返回值,不作用在原数据上;inplace=True无返回值,作用在原数据上

      对序列进行排序用sort_values

      在这里插入图片描述

      ascending有两个值:True和False,升序和降序

      注意:若是之前的表格改变,而且排序后再将值赋给表格会报错,可能是行缺失,可能是排序后值不匹配;所以用inplace=False

      mask.values为False的则不显示,True的显示。通过判断有多少行来求离职的,除以所有的,即为离职率

      在这里插入图片描述

      对一个序列对象如果单纯的想获取值,可以使用values属性

      根据上面的代码我们可以利用Boolean值相加减来获得离职的人数,以此来求离职率

      在这里插入图片描述

      这种方式取出为空,因为你没有索引让他列出值