numpy、pandas做数据清洗
<!doctype html> numpy、pandas做数据清洗 numpy、pandas做数据清洗 numpy、pandas空值的清洗 有两种方式 删除空值所在的行数据 将缺失的行或者列进行删除 使用到的数据判断方法: isnull:判断数据是否是为空,如果为空返回True,否则返回False notnull:判断数据是否非空,如果为空返回False,否则返回True any:与isnull组合判断 dropna:删除数据中的空的行数据或者列数据,axis参数表示与其他相反,行为0,列为1 fillna:对操作数据进行填充参数method='ffill'表示向前填充,'bfill'表示向后填充 方式一的实例: 方法一: from pandas import DataFrame,Series df = DataFrame(data = np.random.randint(0,100,size=(7,5))) #创建一个7行5列的二维数组 #随机取值从0到100,形式是7行5列的数组 #设置是三个空值 df.iloc[3,4] = None #三行四列的值为空 df.iloc[2,2] = np.nan #设置2行2列的值为NAN df.iloc[5,3] = None #设置5行3列的值为空 df #panads会自动将None的空值转换成NaN #清洗空值的两种方式