不再纠结,一文详解pandas中的map、apply、applymap、groupby、agg...
点击 蓝字 关注我,有干货领取! 文章的数据和代码都已上传至我的github仓库:https://github.com/CNFeffery/DataScienceStudyNotes 一、简介 pandas提供了很多方便简洁的方法,用于对单列、多列数据进行批量运算或分组聚合运算,熟悉这些方法后可极大地提升数据分析的效率,也会使得你的代码更加地优雅简洁。 本文就将针对pandas中的 map() 、 apply() 、 applymap() 、 groupby() 、 agg() 等方法展开详细介绍,并结合实际例子帮助大家更好地理解它们的使用技巧。 二、非聚合类方法 这里的非聚合指的是数据处理前后没有进行分组操作,数据列的长度没有发生改变,因此本章节中不涉及 groupby() 。 首先读入数据,这里使用到的全美婴儿姓名数据,包含了1880-2018年全美每年对应每个姓名的新生儿数据,在jupyterlab中读入数据并打印数据集的一些基本信息以了解我们的数据集: import pandas as pd #读入数据 data = pd.read_csv( 'data.csv' ) data.head() #查看各列数据类型、数据框行列数 print(data.dtypes) print() print(data.shape) 2.1 map() 类似Python内建的 map() 方法