Funk

推荐 :机器学习训练中常见的问题和挑战

守給你的承諾、 提交于 2020-10-28 13:19:38
(Datawhale干货 ; 作者:奥雷利安·杰龙) 由于我们的主要任务是选择一种学习算法,并对某些数据进行训练,所以最可能出现的两个问题不外乎是“坏算法”和“坏数据”,本文主要从坏数据出发,带大家了解目前机器学习面临的常见问题和挑战,从而更好地学习机器学习理论。 一、训练数据的数量不足 要教一个牙牙学语的小朋友什么是苹果,你只需要指着苹果说“苹果”(可能需要重复这个过程几次)就行了,然后孩子就能够识别各种颜色和形状的苹果了,简直是天才! 机器学习还没达到这一步,大部分机器学习算法需要大量的数据才能正常工作。即使是最简单的问题,很可能也需要成千上万个示例,而对于诸如图像或语音识别等复杂问题,则可能需要数百万个示例(除非你可以重用现有模型的某些部分)。 数据的不合理有效性 在2001年发表的一篇著名论文中,微软研究员Michele Banko和Eric Brill表明,给定足够的数据,截然不同的机器学习算法(包括相当简单的算法)在自然语言歧义消除这个复杂问题上注8,表现几乎完全一致(如下图所示)。 数据与算法的重要性注 正如作者所说:“这些结果表明,我们可能会重新思考如何在二者之间做权衡—将钱和时间花在算法的开发上,还是花在语料库的建设上。” 对复杂问题而言,数据比算法更重要,这一想法被Peter Norvig等人进一步推广,于2009年发表论文“The Unreasonable

机器学习训练中常见的问题和挑战

守給你的承諾、 提交于 2020-10-21 13:29:38
来源:Datawhale 本文 约4300字 ,建议 阅读8分钟 本文主要从坏数据出发,带大家了解目前机器学习面临的常见问题和挑战,从而更好地学习机器学习理论。 由于我们的主要任务是选择一种学习算法,并对某些数据进行训练,所以最可能出现的两个问题不外乎是“坏算法”和“坏数据”,本文主要从坏数据出发,带大家了解目前机器学习面临的常见问题和挑战,从而更好地学习机器学习理论。 一、训练数据的数量不足 要教一个牙牙学语的小朋友什么是苹果,你只需要指着苹果说“苹果”(可能需要重复这个过程几次)就行了,然后孩子就能够识别各种颜色和形状的苹果了,简直是天才! 机器学习还没达到这一步,大部分机器学习算法需要大量的数据才能正常工作。即使是最简单的问题,很可能也需要成千上万个示例,而对于诸如图像或语音识别等复杂问题,则可能需要数百万个示例(除非你可以重用现有模型的某些部分)。 数据的不合理有效性 在2001年发表的一篇著名论文中,微软研究员Michele Banko和Eric Brill表明,给定足够的数据,截然不同的机器学习算法(包括相当简单的算法)在自然语言歧义消除这个复杂问题上注8,表现几乎完全一致(如下图所示)。 数据与算法的重要性注 正如作者所说:“这些结果表明,我们可能会重新思考如何在二者之间做权衡—将钱和时间花在算法的开发上,还是花在语料库的建设上。” 对复杂问题而言,数据比算法更重要

波士顿动力狗正式开卖!7.45万美元一台,堪比特斯拉Model S

蓝咒 提交于 2020-08-20 01:06:54
  波士顿动力(Boston Dynamics)6 月 16 日突然更新官网,之前火爆全网、会跳 Uptown Funk 和鬼步舞的四足机器狗 Spot 终于在美国境内开放销售,限时包邮。    机器人全名 Spot Explorer,官方定价 7.45 万美元 / 台,约合人民币 53 万元,堪比一台特斯拉 Model S。 现在下单需要先交 1000 美元定金,6-8 周内发货,定金可全额退款。         图 | 那么问题来了:如果你有 7.45 万美元,是买特斯拉,还是买机器狗?   除了 Spot 机器人,7.45 万美元的标准配置还包括两块电池、一套充电器、一套控制装置(平板电脑)、一个 Spot 储存箱,一个备用电池及充电器储存箱,以及 Python API 指导手册。   同时配套销售的还有一系列 Spot 配件,比如额外一块电池要 4620 美元,选装雷达系统要 1.8 万美元,选装 360 度彩色全景摄像头要 2.2 万美元,还可以选择配备特殊定制的 GPU 和 CPU。   当然,并不是所有人都需要雷达系统和全景摄像头,但 如果像买车一样追求顶配,配件全部加起来相当于再买一只 Spot 了。      图 | 各种各样的选装配件,个个价格不菲   鉴于 Spot 可能会应对恶劣的工作环境,波士顿动力还提供额外的增值保险服务,1.5 万美元一年

波士顿动力狗正式开卖!7.45万美元一台,堪比特斯拉ModelS

不打扰是莪最后的温柔 提交于 2020-08-10 16:28:55
  波士顿动力(Boston Dynamics)6 月 16 日突然更新官网,之前火爆全网、会跳 Uptown Funk 和鬼步舞的四足机器狗 Spot 终于在美国境内开放销售,限时包邮。    机器人全名 Spot Explorer,官方定价 7.45 万美元 / 台,约合人民币 53 万元,堪比一台特斯拉 Model S。 现在下单需要先交 1000 美元定金,6-8 周内发货,定金可全额退款。         图 | 那么问题来了:如果你有 7.45 万美元,是买特斯拉,还是买机器狗?   除了 Spot 机器人,7.45 万美元的标准配置还包括两块电池、一套充电器、一套控制装置(平板电脑)、一个 Spot 储存箱,一个备用电池及充电器储存箱,以及 Python API 指导手册。   同时配套销售的还有一系列 Spot 配件,比如额外一块电池要 4620 美元,选装雷达系统要 1.8 万美元,选装 360 度彩色全景摄像头要 2.2 万美元,还可以选择配备特殊定制的 GPU 和 CPU。   当然,并不是所有人都需要雷达系统和全景摄像头,但 如果像买车一样追求顶配,配件全部加起来相当于再买一只 Spot 了。      图 | 各种各样的选装配件,个个价格不菲   鉴于 Spot 可能会应对恶劣的工作环境,波士顿动力还提供额外的增值保险服务,1.5 万美元一年

GMAT句子改错核心句快速突破心得分享

左心房为你撑大大i 提交于 2019-12-05 00:01:53
GMAT语法 对于许多人来说是考试难点,因为句子改错不仅需要大量的语法知识,也要求掌握一定的解题技巧。下面小编就为大家整理汇总了一些GMAT语法的解题方法,帮助大家快速定位核心句,突破复合句长难句问题。 主谓结构 一个句子必须具备一个主谓结构,无论简单句还是复合句,所以大家在分析GMAT句子改错中的复合句时,可以先抓住的就是他的主谓结构。 我们用这条原则来判断一段文是否是完整的句子,或仅仅是一个片段。对这条原则的一般应用为:我们判断试题中是不是具备谓语动词即可。这条原则在GMAT语法解题中大有用武之地,考生应认真掌握。 例子:Directed by George Wolfe, the Broadway musical Bring in Da Noise, Bring in Da Funk telling how tap dancing evolved from the African American experience in the decades following the Civil War. No error 这道题需将telling改为谓语动词形式,否则整个句子没有动词。 逗号原则 逗号原则是指逗号不能用来连接两个句子,它只起语气停顿的作用。考生可利用这条原则迅速做出判断,找到问题所在。所以建议大家最好多看一些GMAT语法书或者教学视频。每天训练适量改错真题

GMAT句子改错核心句快速突破心得分享

拜拜、爱过 提交于 2019-11-25 23:08:52
GMAT语法 对于许多人来说是考试难点,因为句子改错不仅需要大量的语法知识,也要求掌握一定的解题技巧。下面小编就为大家整理汇总了一些GMAT语法的解题方法,帮助大家快速定位核心句,突破复合句长难句问题。 主谓结构 一个句子必须具备一个主谓结构,无论简单句还是复合句,所以大家在分析GMAT句子改错中的复合句时,可以先抓住的就是他的主谓结构。 我们用这条原则来判断一段文是否是完整的句子,或仅仅是一个片段。对这条原则的一般应用为:我们判断试题中是不是具备谓语动词即可。这条原则在GMAT语法解题中大有用武之地,考生应认真掌握。 例子:Directed by George Wolfe, the Broadway musical Bring in Da Noise, Bring in Da Funk telling how tap dancing evolved from the African American experience in the decades following the Civil War. No error 这道题需将telling改为谓语动词形式,否则整个句子没有动词。 逗号原则 逗号原则是指逗号不能用来连接两个句子,它只起语气停顿的作用。考生可利用这条原则迅速做出判断,找到问题所在。所以建议大家最好多看一些GMAT语法书或者教学视频。每天训练适量改错真题