第一节 废话
很多人看到专业术语就龟缩,可是当你在学习一段时间后。。。
回头来看,发现没有什么比这个专业术语更加合适的字了。
所以坚持看完这一系列文章,你会发现新世界。
————作者给萌新说
其实所谓人工智能,就是机器学习的好听名字,什么深度学习,神经网络。。。都是一回事,就是跟电脑说:“兄弟,你帮我学习吧,然后我需要的时候用你一下,好吗?”
如果你功夫够深,这位仁兄会很乖巧的说,“好说好说!”。如果你菜鸡,那么他只会给你一个字,“滚!”
那么,机器学习,从哪开始?哪才是他的’hello world’???
回答:“线性回归!”。
但是注意,这个并非真正意义上的’hello world’ ,因为他并不具备商业价值,啥是?第二集会告诉你。
第二节 先把其它教程忘记
先把其他教程忘记,看完我这篇,然后再回头看其他教程。
你会发现,原来从这个角度进入,很酸爽!
————作者给萌新说
如果一个东西,一个事物,它有点规律,随着某项特征变化,跟随变化,那么我们就可以说它是线性(装逼术语,不要在意)。
例如,
去菜市场买菜,买的菜越多,花的钱也越多(废话)。
那回家的时候,你也许会想,“这么多菜,今天买菜花了多少钱?”
你的脑子会说“几十块把”。
但是如果你只买了颗白菜,你也许会马上回答:“几块钱”(意思就是花的相当少)。
这就是一个线性回归的“完整案例”。因为生活经验告诉你,提着一堆菜回来,肯定花钱多,相反,则少(这就是线性)。但是具体多少钱?就是预测。实际上对不对呢?大多数情况会有偏差。那你怎么就能猜出那个数字?比如这一堆菜25元,因为生活经验啊!
列出表格如下:
首先:
图中,那些灰色点,就代表你买菜回来看看钱包还剩多少钱的真实训练数据。因为你开始没经验,也没感觉,所以你对“今天买多少钱菜?”这个问题没有什么概念,于是你每次回来就看钱包(当然是大概的看一看)。
这就是你有真实数据,让你的大脑训练出一条数据线,红色这条,这就是你的生活经验。
然后:
图中,绿色点,对应的Y轴,也就是对应“几袋青菜”。那么你脑子(没有被僵尸吃掉的情况下),就是自动根据生活经验预测出20元。
最后:
你会问,那为啥不是所有点全部通过红线呢?这就涉及到误差问题。
当你第一次买菜回来,并看看你花了多少钱的时候,你会说,“今天菜价涨了,我多花钱了”。而下一次,有可能你又会说,“今天这菜市场上蛮多的,又便宜,不错!”,于是乎,就又了偏差值,有时候多一点,有时候少一点。这就是为啥,有的点在红线上面,有的点在红线下面。
上述内容对应到机器学习,如下:
每次买菜回来看看钱包剩下多少钱,并记录在脑子里,这就是————真实数据。
你的脑子,就是————电脑。
你的脑子训练出生活经验,就是————训练后的机器学习模型(即图中红线)。
你想要预测今天买菜花了多少钱,就是————图中的绿色点,通过Y轴(几袋青菜)预测X轴(20元)。
第三节 补充一点
很多同学可能要问:线性已经明白了,但是回归怎么解释呢?
其实你大致可以理解成下面这个故事:
“今天菜价涨了,我多花钱了”(某一天)
“今天这菜市场上蛮多的,又便宜,不错!”(某一天)
实际上,你想表达的意思是,“本来不该这么贵啊!” “今天我赚到了!”,那么你的生活经验在总结的时候,就会稍微排除掉这些误差,让你的生活经验认为,应该更加客观一点,因为只有这样,你才能更加容易的记住多少菜花了多少钱,因为你不可能记住每一次菜贵或者便宜了,换句话说,未来在预测的时候,你要的是过去经验的高度总结,也才会更加准确,因为你骨子里喜欢准确点,因为这样好装逼。
总结
到这里,我们其实已经把线性回归这个问题说的很好理解了。有的同学就要问了,这玩意有啥用?我买个菜还要用电脑预测价格?当然不是,这仅仅是为了理解机器学习而举的例子好理解,想表达的意思是:机器学习真的能用!
来源:CSDN
作者:weixin_43605788
链接:https://blog.csdn.net/weixin_43605788/article/details/104328128