之前有篇博客写了Python 的 Numpy模块, 这次来写一下Pandas
pandas采用了很多Numpy的代码风格,但最大的不同在于pandas是用来处理表格型或者异质型数据的。
而Numpy更适合处理同质型的数值类数组数据。
接下来主要介绍pandas模块里的Series、DataFrame这两个方法。
Series是一种一维的数组型对象,包含了数据标签,称为索引(index)
最简单的序列可以仅由一个数组形成:
索引在左边,值在右边。
通常需要创建一个索引序列,用标签标识每个数据点
可以从数据中选择数据的时候使用标签来进行索引:
可以使用字典生成一个Series:
接下来介绍DataFrame:
在DataFrame中,数据被存储为一个以上的二维块,而不是列表、字典或其他一维数组的集合。