Pandas数据处理——盘点那些常用的函数
.head() 作用对象: Series 和 DataFrame 主要用途:返回 DataFrame 的前N行。当数据量较大时,使用 .head() 可以快速对数据有个大致了解。 用法: In [16]: data.head() Out[16]: company salary age 0 NaN 43 21 1 A 8 41 2 A 28 26 3 C 42 28 4 A 33 26 .info() 作用对象: Series 和 DataFrame 主要用途:打印所用数据的一些基本信息,包括索引和列的数据类型和占用的内存大小。 用法: In [17]: data.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 9 entries, 0 to 8 Data columns (total 3 columns): company 8 non-null object salary 9 non-null int32 age 9 non-null int32 dtypes: int32(2), object(1) memory usage: 224.0+ bytes .describe() 作用对象: Series 和 DataFrame 主要用途:生成描述性统计汇总,包括数据的计数和百分位数,有助于了解大致的数据分布 用法: