[ch05-00] 多变量线性回归问题
系列博客,原文在笔者所维护的github上: https://aka.ms/beginnerAI , 点击star加星不要吝啬,星越多笔者越努力。 第5章 多入单出的单层神经网络 5.0 多变量线性回归问题 5.0.1 提出问题 问题:在北京通州,距离通州区中心15公里的一套93平米的房子,大概是多少钱? 房价预测问题,成为了机器学习的一个入门话题,著名的波士顿的房价数据及相关的比赛已经很多了,但是美国的房子都是独栋的,前院后院停车库游泳池等等参数非常多,初学者可能理解起来有困难。我们不妨用简化版的北京通州的房价来举例,感受一下房价预测的过程。 影响北京通州房价的因素有很多,居住面积、地理位置、朝向、学区房、周边设施、建筑年份等等,其中,面积和地理位置是两个比较重要的因素。地理位置信息一般采用经纬度方式表示,但是经纬度是两个特征值,联合起来才有意义,因此,我们把它转换成了到通州区中心的距离。 我们有1000个样本,每个样本有两个特征值,一个标签值,示例如表5-1。 表5-1 样本数据 样本序号 地理位置 居住面积 价格(万元) 1 10.06 60 302.86 2 15.47 74 393.04 3 18.66 46 270.67 4 5.20 77 450.59 ... ... ... ... 特征值1 - 地理位置,统计得到: 最大值:21.96公里 最小值:2.02公里