首页 > 其他 > 详细

3-3 groupby操作

时间：2019-10-08 19:42:49 阅读：73 评论：0 收藏：0 [点我收藏+]

Pandas章节应用的数据可以在以下链接下载： https://files.cnblogs.com/files/AI-robort/Titanic_Data-master.zip

In [1]:

import pandas as pd
df=pd.DataFrame({‘key‘:[‘A‘,‘B‘,‘C‘,‘A‘,‘B‘,‘C‘,‘A‘,‘B‘,‘C‘],
                 ‘data‘:[0,5,10,5,10,15,10,15,20]})
df

Out[1]:

	key	data
0	A	0
1	B	5
2	C	10
3	A	5
4	B	10
5	C	15
6	A	10
7	B	15
8	C	20

In [3]:

for key in[‘A‘,‘B‘,‘C‘]:
     print(key,df[df[‘key‘]==key].sum())#求每个key值的求和

A key     AAA
data     15
dtype: object
B key     BBB
data     30
dtype: object
C key     CCC
data     45
dtype: object

In [4]:

df.groupby(‘key‘).sum()#和上面的分组是一样的

Out[4]:

	data
key
A	15
B	30
C	45

In [7]:

import numpy as np
df.groupby(‘key‘).aggregate(np.mean)#aggregate是执行操作，如np的sum 、mean等

Out[7]:

	data
key
A	5
B	10
C	15

In [8]:

df1=pd.read_csv(‘./Titanic_Data-master/Titanic_Data-master/train.csv‘)

In [13]:

df1.groupby(‘Sex‘)[‘Age‘].mean()#统计性别对应的年龄的均值

Out[13]:

Sex
female    27.915709
male      30.726645
Name: Age, dtype: float64

In [14]:

df1.groupby(‘Sex‘)[‘Survived‘].mean()#统计性别对应的获救的平均概率

Out[14]:

Sex
female    0.742038
male      0.188908
Name: Survived, dtype: float64

3-3 groupby操作

原文：https://www.cnblogs.com/AI-robort/p/11636749.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！