Pandas的merge和groupby用法

匿名 (未验证) 提交于 2019-12-03 00:20:01

1.merge用来连接两个DataFrame对象,参数on选择基于哪个列进行连接,how选择内连接,左连接还是全连接的方式。merge操作类似于SQL中的join操作。

  1. import
  2. 'key':['b','b','a','c','a','b'],'data1':range(6
  3. 'key':['a','b','a','b','d'],'data2':range(5
  4. print
  5. print
  6. 'key''left'
  7. print

2.对于大数据,很可能要对于其中的部分列进行聚合,这里使用groupby
  1. import
  2. import
  3. 'key1':['a','a','b','b','a'
  4. 'key2':['one','two','one','two','one'
  5. 'data1':np.random.randn(5
  6. 'data2':np.random.randn(5
  7. print
  8. 'data1','data2']].groupby(df['key1'
  9. print
  10. print'key1')[['data1','data2'#简便写法
注意,这里还可以利用字典对表进行分组聚合,这里以行聚合为例(以列分组聚合只要修改字典并把axis设置成1)

  1. import
  2. import
  3. 'key1':['a','a','b','b','a'
  4. 'key2':['one','two','one','two','one'
  5. 'data1':np.random.randn(5
  6. 'data2':np.random.randn(5
  7. print
  8. 0:'one',1:'one',2:'two',3:'two',4:'two'
  9. print0
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!