一、汇总统计及其方法
二、相关性和协方差
1、相关性:
.corr()
.corrwith()可以计算出DataFrame中的行或列与另一序列或DataFrame的相关性
2、协方差: .cov()
三、唯一值、计数和成员属性
(一)唯一值.unique()
计数.value_counts()默认按照降序来排序
例如:
import numpy as np
import pandas as pd
obj = pd.Series([‘c’,‘a’,‘d’,‘a’,‘a’,‘b’,‘b’,‘c’,‘c’])
s =obj.unique()
print(s)
print(obj.value_counts())
(二)成员属性
1、isin用于执行向量化的成员属性检查,即用来检测某个元素是否在某个范围内,返回值为布尔型,还可以将数据集以Series或DataFrame一列的形式过滤为数据集的值子集
例如:
import numpy as np
import pandas as pd
obj = pd.Series([‘c’,‘a’,‘d’,‘a’,‘a’,‘b’,‘b’,‘c’,‘c’])
print(obj)
s=obj.isin([‘b’,‘c’])
print(s)
来源:CSDN
作者:DAN_L
链接:https://blog.csdn.net/DAN_L/article/details/104739592