08_特征预处理之标准化

社会主义新天地 提交于 2019-12-01 23:08:31

1.标准化特点:通过对原始数据进行变换把数据变换到均值为0,方差为1范围内。

   对数据进行缩放首先想到标准化!!!

 

2.公式:

 注:公式作用于每一列,mean为平均值,σ为标准差

   

 

    其中:方差考量数据的稳定性

 

3.结合归一化来理解标准化

 

 

4.用法:

 sklearn特征化API:  scikit-learn.preprocessing.StandardScaler

 

 StandardScaler(…) 处理之后每列来说所有数据都聚集在均值0附近方差为1

 StandardScaler.fit_transform(X,y) X:numpy array格式的数据[n_samples,n_features] 返回值:转换后的形状相同的array

 StandardScaler.mean_ 原始数据中每列特征的平均值(现在这个方法改为了.with_mean , 但是我打印这个结果为true)

 StandardScaler.std_ 原始数据每列特征的方差 (现在这个方法改为了.with_std)

 

5.标准化步骤:1、实例化StandardScaler   

       2、通过fit_transform转换

 

6.案例:对[[ 1., -1., 3.], [ 2., 4., 2.], [ 4., 6., -1.]]进行标准化

  

from sklearn.preprocessing import StandardScaler

def stand():
    """
    标准化缩放
    """
    std = StandardScaler()
    data = std.fit_transform([[1., -1., 3.], [2., 4., 2.], [4., 6., -1.]])
    print(std.with_mean)
    print(std.with_std)
    print(data)


if __name__ == '__main__':
    stand()

"""
结果:
True
True
[[-1.06904497 -1.35873244  0.98058068]
 [-0.26726124  0.33968311  0.39223227]
 [ 1.33630621  1.01904933 -1.37281295]]
"""

  

  

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!