在处理数据中,我们常常要进行分组运算,达到我们某个目的。
首先介绍一下,分组运算时常用到以下公式:
min():最小值、max():最大值、mean():均值 、median():中位数 var():方差等等
话不多说,举例运用这个分组运算,助你处理数据动起来。
在【数据.xlsx】中,想要把年级按照一年级(1)班、一年级(2)班分别计算平均成绩。
第一步:用Python读取该表【数据.xlsx】
import pandas as pd data=('C:/Users/yellow/Desktop/数据.xlsx',header=0)
第二步:用groupby()函数进行分组,mean()求均值。
data1=da(by='年级')['成绩'].mean()
解析该句含义,用到groupby(by='年级'),说明分组【年级】这个字段,['成绩']用来求这个字段的均值。注意:需要赋值给变量data1,否则print(data)还是没有groupby的结果。
print(data1)
打印查看结果。
正常打印。已经分组求平均值。其他count()/sum()也是同样道理。
data1=da(by='年级')['成绩'].count()
data1=da(by='年级')['成绩'].sum()
以下是完整代码:
import pandas as pd data=('C:/Users/yellow/Desktop/数据.xlsx',header=0) #print(data) data1=da(by='年级')['成绩'].sum() print(data1)
学会分组之后,处理简单的分组运算将会变得简单许多,如需要求和年份数据,季度数据,月份数据时得心应手。
原创不易,以上纯手写。欢迎大家来逛逛,持续更新python实用小技巧~