机器学习实例(六)美国波士顿地区房价预测
回归问题预测的目标是连续变量 数据描述 # 从sklearn.datasets导入波士顿房价数据读取器 from sklearn . datasets import load_boston # 从读取房价数据存储在变量boston中 boston = load_boston # 输出数据描述 boston . DESCR Number of Instances: 506 Number of Attributes: 13 numeric/categorical predictive.Median Value (attribute 14) is usually the target. Missing Attribute Values: None 由上述可知,该数据集共有506条美国波士顿地区房价的数据,每条数据包括对指定房屋的13项数值型特征描述和目标房价(平均值)。另外,该数据中没有缺失的属性/特征值 数据处理 from sklearn . model_selection import train_test_split import numpy as np X = boston . data y = boston . target # 随机采样25%的数据构建测试样本,其余作为训练样本 X_train , X_test , y_train , y_test = train_test