texas

pandas 模块

烈酒焚心 提交于 2019-12-05 05:26:29
numpy 与pandas In [46]: import numpy as np import pandas as pd np.add()/df.add() 加法运算 + np.aubtract()/df.aubtract() 减法运算 - np.megative() 负数运算 - np.multiply() 乘法运算 * np.divide() 除法运算 / np.floor_dicide() 向下整除 // np.power() 指数运算 ** np.mod() 求余数 % np.abs() 求绝对值 np.sin() ,cos(), tan() 求正弦 余弦 正切 np.exp(x) e为底的x次方 np.exp2(x),2为底的x次方 np.log(x) e为底对x开根号 np.log2(x) 2为底 np.sum() min() max() 求和 求最小值 求最大值 axis=0 列 axis=1 行 np.prod() 计算元素的积 np.mean() 计算元素的平均值 np.std() 计算元素的标准差 np.var() 计算元素的方差 np.argmin()找出最小值的索引 np.median()计算元素的中位数 np.any() 验证是否存在元素为真 np.all() 验证所有元素是否为真 Out[46]: 3.0 In [2]: data=pd.Series(

python之padnas学习(四)

匿名 (未验证) 提交于 2019-12-02 22:11:45
A.整数索引: 用整数索引在pandas中 与python的list与truple有一点不同,如果在Series的默认row Index为数字的话,用整数索引会出错,那么我们就应该将index更改掉,改成其它。 1. import numpy as np import pandas as pd obj=pd.Series(np.arange(3.)) print(obj) print(obj[-1]) 看得出来如果这样会报错! 因为在我们创建Series的时候index 为0,1,2 .而我们obj[-1] 表达的意思和它起冲突了,所以程序想知道我们想要什么就困难。我们需要的倒数第一个,而它以为我们是要index为-1的这个数据,所以就会报错。那么我们创建时将index更改掉,那么就可以了! obj1=pd.Series(np.arange(3.),index=['a','b','c']) print(obj1[-1]) 2. 其实也可以这样索引,从输出中看出每个的不同,这里我用的是创建的第一个对象obj,不是obj1 print(obj[:1]) print(obj.loc[:1]) print(obj.iloc[:1]) B.算数与数据对齐: padnas一个特点是,两个相同的数据结构相加,那么他们的索引值对应相加,如果这两个,其中一个有不同的index,那么相加后

NumPy基本操作快速熟悉

好久不见. 提交于 2019-11-27 05:31:34
本文包含一些 Pandas 的基本操作,旨在快速上手 Pandas 的基本操作。 读者最好有 NumPy 的基础,如果你还不熟悉 NumPy,建议您阅读 NumPy基本操作快速熟悉 。 Pandas 数据结构 Pandas 有两个核心的数据结构: Series 和 DataFrame 。 Series Series 是 一维的类数组对象 ,包含一个 值序列 以及对应的 索引 。 1 obj = pd.Series([6, 66, 666, 6666]) 2 obj 0 6 1 66 2 666 3 6666 dtype: int64 此时索引默认为 0 到 N。我们可以分别访问 Series 的值和索引: 1 obj.values 2 obj.index # 类似于 range(4) array([ 6, 66, 666, 6666]) RangeIndex(start=0, stop=4, step=1) 索引可以用标签来指定: 1 obj2 = pd.Series([6, 66, 666, 6666], index=['d', 'b', 'a', 'c']) 2 obj2 3 obj2.index d 6 b 66 a 666 c 6666 dtype: int64 Index(['d', 'b', 'a', 'c'], dtype='object') 可以使用 标签索引