08_特征预处理之标准化
1.标准化特点:通过对原始数据进行变换把数据变换到均值为0,方差为1范围内。 对数据进行缩放首先想到标准化!!! 2.公式: 注:公式作用于每一列,mean为平均值,σ为标准差 其中:方差考量数据的稳定性 3.结合归一化来理解标准化 4.用法: sklearn特征化API: scikit-learn.preprocessing.StandardScaler StandardScaler(…) 处理之后每列来说所有数据都聚集在均值0附近方差为1 StandardScaler.fit_transform(X,y) X:numpy array格式的数据[n_samples,n_features] 返回值:转换后的形状相同的array StandardScaler.mean_ 原始数据中每列特征的平均值(现在这个方法改为了.with_mean , 但是我打印这个结果为true) StandardScaler.std_ 原始数据每列特征的方差 (现在这个方法改为了.with_std) 5.标准化步骤:1、实例化StandardScaler 2、通过fit_transform转换 6.案例:对[[ 1., -1., 3.], [ 2., 4., 2.], [ 4., 6., -1.]]进行标准化 from sklearn