关注涛涛CV,设为星标,更新不错过
-------------------------------------------
《智能革命:迎接人工智能时代的社会、经济与文化变革》笔记
通过这个读书笔记,可以快速掌握该书里面的核心观点,为您节省理解阅读的时间。个人觉得该书很好,所以将精华笔记内容推荐给大家,让大家快速理解该书的表达内容与思路,共同学习、共同进步、互帮互助。
作者:李彦宏
简介:
人类历史上的历次技术革命,都带来了人类感知和认知能力的不断提升,从而使人类知道更多,做到更多,体验更多。以此为标准,李彦宏在本书中将人工智能定义为堪比任何一次技术革命的伟大变革,并且明确提出,在技术与人的关系上,智能革命不同于前几次技术革命,不是人去适应机器,而是机器主动来学习和适应人类,并同人类一起学习和创新这个世界。“人工智能”正式写入2017年政府工作报告,折射出未来人工智能产业在我国经济发展与转型中的重要性。本书内容涵盖了人工智能发展的主要领域,刻画了人工智能未来发展的场景和商业模式,对我国各行各业应对智能化转型提供了很好的指引和借鉴。
141个笔记:
◆ 自序
>> 全世界都在为即将到来的人工智能革命感到振奋。这种情绪就仿佛二十多年前我在硅谷亲历互联网大潮初起时所感受到的。
>> 搜索引擎一直在推升计算机科学的天花板。几乎计算机科学的每一个层面,从硬件到软件的算法,再到数据,都在被持续推进,有一天一定会触碰到人工智能这个方向。
>> 海量的数据,越来越强的计算能力,越来越低的计算成本,在搜索领域汇聚到一起,铺就了人工智能的回归之路。
>> “机器学习”的本质之一,就在于从人类大量行为数据中找出规律,根据不同人的不同特点、兴趣提供不同的服务。
>> 陆奇称智能时代的核心本质是“knowledge inevery system, intelligence in every interaction”(知识无处不在,任何交互都是智能的)
◆ 序二 AI时代的曙光
>> 一个具有智能特性的人造系统,它产生、输出的内部的运算过程是人类智能所无法解析的。换句话说,只有我们不知道机器在想什么、怎么想时,才认为它有智能。
◆ 01 简史:互联网风云背后的人工智能生长
>> 你能看见多久的历史,就能看见多远的未来。
◆ 人工智能的黎明
>> 明斯基已经造出第一台神经网络计算机(他和同伴用3000个真空管和一台B-24轰炸机上的自动指示装置来模拟40个神经元组成的网络),不久后写出了论文《神经网络和脑模型问题》
>> 超前的人工智能遇到两个难以克服的瓶颈:一个是算法逻辑自身的问题,也就是数学方法的发展还不够;另一个是硬件计算能力的不足。
◆ 百炼成钢
>> 语音识别能力、图像识别能力、自然语言理解能力,包括为用户画像的能力,这些都是人的最本质的智慧能力。
>> 这两年促使人工智能再度技惊世人的技术,则是机器学习技术的升华版——基于多层计算机芯片神经网络的“深度学习”方法。通过多层芯片联结,模仿人脑大量神经元的网状联结方式,辅以精妙的奖惩算法设计和大数据,可以训练计算机自己从数据中高效地寻找模型和规律,从而开启了一个机器智能的新时代。
>> 在2013年1月,百度年会上我正式宣布了IDL(深度学习研究院)的成立,这应该是全球企业界第一家用深度学习来命名的研究院。
◆ Internet的大会师
>> 蒙特卡洛搜索算法和基于深度学习的模式识别促成了AlphaGo的成就
>> 20世纪90年代以后,人类认识到人工智能没必要像人类那样思考,只要能够解决人类的问题即可。所以语言学家乔姆斯基在被问及“机器可以思考吗?”的时候,借用丹麦计算机科学家迪克斯特拉(Dijkstra)的说法反问:“潜艇会游泳吗?”潜艇不会像鱼儿或者人类那样摆动身姿游泳,但是它的水下能力非常好。
◆ 巨头群起逐鹿
>> 回顾过去,失败只是源于缺少数据量和计算能力”。
>> 《乌镇指数:全球人工智能发展报告》显示,2016年前两季度,国内新增60余家人工智能创业公司,投资金额达到6亿美元。
>> 2016年,百度语音识别准确率达到97%、人脸识别准确率达到99.7%。作为百度大脑的云化,百度天算、天像、天工和天智平台相继向全社会全面开放百度大脑的技术和能力。
◆ 超强大脑汇聚
>> 人工智能背后的专业知识与数学、生物学等基础学科有极大相关性。
◆ 技术要做人类生命的延伸
>> 今天,除了谷歌、微软和BAT这样的大公司,互联网和大数据技术的“去中心化”发展趋向,使得小企业、有才华的技术人员甚至广大用户都成为具有决定格局态势的力量。
◆ 数据大道
>> 智能地图可以根据用户移动快慢测量道路的拥堵程度,还可以智能规避单双号限行路线。结合虚拟现实技术,可以让人身临其境般寻找路线。以交通大数据为基础,加上算法辅助,响应交通管理部门的需求,智能地图系统已经能为城市交通缓解提供解决方案,大大减少了交管部门的压力。
◆ 人工智能既不是神话也不是笑话
>> 如果我们以科普的心态看待历史,就会发现人工智能既不是神话也不是笑话,而是从人类的劳动创造中实实在在生长出来的。我们不需要恐惧也不需要顶礼膜拜。
>> 今天的人工智能思路与过去不同,变思维规则问题为数据问题和策略问题。过去人类总想为计算机设计出完美的逻辑,不断把人类的种种逻辑规则抽象成函数之后输入计算机里。现在的人工智能主要基于大数据基础和算法的进步。
◆ 非如此不可
>> 我们开放深度学习开发平台PaddlePaddle,让更多有志者可以创造属于自己的人工智能服务。
>> 马斯克去开发火箭,其实是国家把NASA(美国国家航空航天局)的火箭技术和团队转移给他。
◆ 未来已来:焦虑与梦想
>> 他批评人类放慢了进步速度,嬉皮文化代替了进步主义,风投热衷于投资轻资产企业,其中大部分是移动互联网公司,如Airbnb(空中食宿)、优步之类,却对未来没有清晰的规划和信心。他认为“互联网+”时代人类在比特层面进步大,在原子层面进步小。因此他果决地投资火箭、抗癌药物以及人工智能。
◆ 陆氏猜想
>> 陆奇的个人信念是:知道更多,做到更多,体验更多。
◆ 下一个浪潮
>> 而人工智能计算的本质,简单来说,非常不同于冯·诺依曼的控制流结构,后者采用线性的记忆体和布尔函数作为基线计算操作。而新的范式是神经网络计算,其特征在于分布式的表示和激活模式。
>> 这促使我们开始深入思考,人工智能企业的标准是什么?哪些是真正的人工智能公司,哪些不是。
◆ 衡量人工智能的现实标准
>> 百度大脑是硬件基础、数据基础和算法能力的紧密结合,是云计算、大数据和人工智能的三位一体,是百度技术战略的核心。云计算是基础设施、大数据是燃料、人工智能是发动机,联合驱动着“互联网的物理化”,将数字世界的互联网技术和商业模式又送回到物理世界,全面改变社会。
◆ 人工智能+世界
>> 和前几年讨论“互联网+”一样,人们现在开始讨论“人工智能+”,“+”商业、工业、医疗、教育等。如果从“知道更多,做到更多,体验更多”的角度来看,人工智能对世界的改变是根本性的,也就是说,这是一个“人工智能+世界”的问题。
>> 苹果和乔布斯对这个世界最大的贡献是改为用手指来交互,从而改变了世界。而人工智能时代的改变更大,人类将可以用自然语言跟任何器件交流。
>> 你懂的比别人多,看的比别人多,能做到的就比别人多,你就比别人强大。
◆ 中国的优势与我们的责任
>> 两家公司也有不同,百度的创新空间和在某些领域的创新速度可能比谷歌更大、更快,这源于中国的国情与美国的国情不一样。移动互联网在中国的创新程度在很多层面已经超过了美国。
>> 比如,医疗和教育是人工智能应用潜力非常大的领域,因为其本质都是数据问题,高级教师和老医生一样,能力来自经验(数据)积累,未来我们可以让机器自动分析数据,辅助医生对症下药,辅助教师个性化施教。医疗或者保健能让人的生活更健康,教育能给人更多的知识,因此,人工智能在这两个领域的社会应用价值巨大。
◆ 企业挑战:如何落地
>> 在工作态度上,陆奇常说:“Head above cloud,Feet on ground”,就是脑袋要在云端之上,才能看得远,看得清,但是你的脚必须要踩在坚实的大地上,一步一步向前迈进。
◆ 智能社会的文化和长期管理
>> 相比学习人工智能的新方法,更困难的在于忘却旧模式下的工作方法。
>> 有目的地进行长期管理是抓住任何重要机会而不仅仅是人工智能浪潮的关键。如何调整结构来吸引更多的资金和人才以及放置更多的改变游戏格局的赌注,对企业领袖而言都是一个有趣且极具挑战性的工作。
◆ 人工智能技术目前的发展状态
>> 因为科学的真谛就是观察世界、总结知识。
>> Matthew Fisher(马修·菲舍尔)、潘建伟、朱清时等科学家都认为,意识的本质就是量子纠缠。
◆ 在历史的重复中变化
>> 人工智能眼中的数据含义远比这些广泛。数据的存在形式随着人类文明的发展不断改变,从最初的声音、文字、图画和数字,到电子时代的每一张图像、每一段语音、每一个视频,再到如今互联网时代人类的每一次鼠标点击、用手机时的每一次手指滑动,乃至每一下心跳和呼吸,甚至还包括经济生产中的一切人机动作、轨迹,皆已融入数据流。
>> 五千多年前,古埃及人就通过观测记录星象的位置总结出规律:每年当天狼星清晨出现在东方地平线上的时候,尼罗河便开始泛滥。他们照此制订农业耕作的计划,并且将这个周期进行总结,确定了一年365天的太阳历。遥远的天狼星与地球并无任何因果关系,只是出现在那个位置的时候,正好地球运转到一定的节气——这正是大数据时代的相关性计算的前身。
>> 拟合函数方法适合从大量离散的数据记录中找寻规律,而这正是今天人工智能的基础,机器学习的基本数学方法。
>> 让机器自己来处理数据,从数据里习得知识。这便是当代人工智能的本质。
◆ 数据书写生活史
>> 一部智能手机一天之内就可以为他的主人生产1G的数据。这大概是13套《二十四史》的总容量。我们每天都在用数据书写自己浩瀚的“生活史”。
◆ 大数据——万物皆数
>> 第二,大数据的另一个重要特点是多维度。
◆ 人类的数据镜像
>> 美国新任总统特朗普就是一位充分利用数据竞选的总统。据彭博等媒体报道,他的技术团队通过脸书、推特等平台上的用户公开数据,如点赞、转发、收藏行为等,精准描述选民画像,向他们推送因人而异的竞选广告。甚至特朗普的每条推特、每条脸书都是有针对性的,不同内容对不同网民可见。
>> 未来我们可以将个人数据上传,通过大数据检测我们罹患各种疾病的可能性或者潜在威胁,更好地预防疾病。
◆ 突破:机器学习与人工智能
>> 1950年,阿兰·图灵创造了一个针对机器的测试方法,即后来大名鼎鼎的“图灵测试”。这位充满传奇色彩的科学家认为,如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么就可以认为这台机器具有智能。
>> 如果多台电脑、多个芯片联网进行机器学习,而且具备多个芯片网络层次,就进入了所谓的“深度学习”的范畴。在20世纪70年代末,GeoffreyHinton教授等人已经发现,如果能实现多层的神经网络,就可以逐层递进找到模式中的模式,让计算机自己解决复杂的问题。那时他们就开发了“反向传播”算法神经网络。但是多层神经网络的复杂性也导致对其训练的难度大大增加,数据不足和硬件计算能力成为掣肘。
◆ 计算机神经网络生长与深度学习
>> 当下流行的深度神经网络可分为应对具有空间性分布数据的CNN(卷积神经网络)和应对具有时间性分布数据的RNN(递归神经网络,又称循环神经网络)。
>> 深度学习神经网络模拟了人脑的神经节点,每个节点实际上就是一个函数调节器,无数函数彼此交叉连接起来。通过数学上的矩阵、优化、正则式等各种方法,深度学习过程不断调整着每个函数系数的权重,在数据充分、构造原理合适的情况下,不断演化的函数会越来越准确地拟合大部分数据,于是我们就可以通过这套函数来预测尚未发生的情况。这个过程就是我们所说的“训练”。
◆ 深“度”往事
>> 安防企业宇视科技就开发了这样的智能摄像系统,再结合百度地图,就可以迅速定位嫌疑人或者车辆的运动轨迹。
>> GPU本来是显卡,用来渲染图像,给图形计算加速,后来却成为深度学习的主要硬件。因为显卡芯片具备比CPU更强的浮点运算能力,原本就用于处理图像这种矩阵数据,非常适合机器学习领域对数据的计算。早期当吴恩达团队率先使用GPU进行机器学习的时候,很多人并不理解。不过今天这已经成为主流。
◆ 搜索引擎:人工智能的命运细线
>> 仅就知识图谱来说,基于不同的应用需求可分为三类:实体图谱(entitygraph)、关注点图谱(attentiongraph)和意图图谱(intentgraph)。
>> 搜索所需要的技术基础也正是人工智能所需要的技术基础。比如就云计算来说,主管百度云工作的张亚勤认为,搜索是最大的云计算应用,没有云就没有办法做好搜索,百度是在云里出生的。
◆ 人机世界迫切需要新的大脑
>> 很多人工智能科学家都拥有生物学和计算机科学两个方向的专业背景,这大概是智能生物发展的一个缩影。
◆ 第一棒:百度大脑
>> 百度人工智能业务最基础的是“物料层”,有基于GPU/FPGA的云计算平台、深度学习代码平台和大数据储备。这一层提供了进化的环境和工具。最上层SaaS是人工智能的各种应用。
>> 人工智能基础技术层”包括语音识别、图像识别、自然语言处理以及所有的知识图谱、商业逻辑和用户画像。
>> 目前,百度宣布将向社会免费开源人工智能深度学习平台PaddlePaddle,开放百度大脑开放平台ai.baidu.com。前者为开发者提供算法编程环境,后者为应用开发者、数据工程师、数据科学家提供现成的百度人工智能成果接口。
◆ 百度大脑的听与说
>> 作为“大脑”最基本的能力之一,实现“听”这一功能的语音识别技术研究经历了从标准模板匹配转向基于统计模型再到深度神经网络的过程。
>> 语音识别的场景应用极为广泛。比如我们可以借此创造出一个“最强销售员”:销售员新手给客户打电话时,百度大脑实时记录客户的回复,并显示在电脑屏幕上,系统可以瞬时搜索并调取优秀销售员以往对这些问题给出的回复。这样,每个“菜鸟”只要“照本宣科”,就能在上岗第一天掌握过去最优秀的销售员所具备的交流能力
>> 上帝曾伸手割裂了人类的语言统一,让四面八方的人由于语言不同而无法沟通。有了机器翻译,人类终于可以携起手来,建造出一座真正的巴别塔[插图]。
◆ 百度大脑的好视力
>> 世界上最大的图像识别数据库ImageNet的图片分类有1000多类。而百度图片数据库的分类则已经达到4万类。
◆ 时代召唤中国大脑
>> 我不在乎华尔街怎么看,我一定要把这事儿做成。
>> 粒子研究的重要性在科幻小说《三体》中表现得淋漓尽致——外星智慧生物为了阻止地球科技进步,利用量子纠缠原理创造出拥有十一维度形态的“智子”,发射到地球上。以光速运动的智子能同时干扰人类的所有粒子对撞机,精确破坏粒子对撞结果,锁死人类的基础物理研究,将人类科技禁锢在一个较低的水平上。
>> 在我们这个拥有超过13亿人口,7亿网民和数以千万计工程师、科学家的大国,海量的数据、充沛的人才、丰富的企业案例、各种各样的应用场景像流水一样奔腾。如果不能物尽其用,错过这一波智能浪潮,而将科技制高点乃至国家安全拱手相让,才是真正的“浪费”。
◆ 中国大脑,中国气派
>> 从科学到科技再到产品,就像一个4×100的接力赛,每一棒都有它特别的功能,学术界应该算是这个4×100接力赛的第一棒,工业界和实验室是第二棒,产业化、投资是第三棒、第四棒。
>> 微软聊天机器人TAY在推特上玩耍了24小时,就学会满口脏话、种族歧视、性别歧视,这倒是非常的“美国特色”。
>> 驱动的另一个源头则是产业焦虑。中国制造业成本上升很快。放眼全球,工业越来越自动化和智能化,高端制造业可能会回到欧美,而低端制造业已开始流向越南等国。如果不在短时间内完成产业转型,中国制造业将面临“空心化”的困境:高端制造业、低端制造业都将流出中国——这个转型,能不依赖人工智能这一环吗?
>> 如果说网民的需求是“天时”,企业与政府的合作是“人和”,数据则是中国大脑发展必不可少的“地利”。在这一领域,中国更是得天独厚。
>> 人文主义画家米开朗基罗完成了雄伟的壁画《创世纪》,其中有这样一幕:上帝之手触碰亚当指间的那一瞬,智慧的启蒙就此产生。这幅壁画中上帝的袍服宽大张扬,最近几十年,有人指出上帝袍服的形状其实是一个人类大脑的解剖图。在这幅壁画里,米开朗基罗悄悄藏进了启蒙的密码——上帝就在人类自己的大脑中,是人类自己启蒙了自己!
◆ 从勤劳革命到智能革命
>> 制造业空心化使得人工智能等高新技术无法在本国充分落地消化。而中国遍地成规模的制造业、服务业,加上每年高校培养出的百万级工程师与海归人才,使得人工智能的原力正在获得释放。
◆ 三次技术浪潮冲击下的第一制造大国
>> ERP曾经被视为企业信息系统的核心,如今也已看见衰落的景象。尽管ERP的模板开发相当于对大量企业的数据进行了人工的深度学习,找出基本模式,还可以针对每个用户的特点进行二次开发。但本质上仍然是一种集中开发的模式,弹性不足,部署周期长,和业务有脱节,这是造成“谁都不太懂”的根源。ERP跟不上近年商业环境的变化,逐渐被云计算所替代。云计算不只是一种技术,同时也代表一种理念。对应着云(分布式)计算,企业也要从传统的集中管理转变为分布式管理。
>> 3D打印的关键不在于技术,而是反映了制造业从大规模标准化生产转向大规模定制生产的趋势,最终反映了客户需求个性化、自组织化的趋势。
◆ 昔日制造大国:人为物役
>> 人工智能目前刚刚走到自己的石器时代,如果说以前的计算机工作模式是条件反射,只能完成程序预设的任务,今后人类则致力于教会它自己开发“工具”。
◆ 只有新工业自动化才能契合人类多样性
>> 基于人工智能的“用户画像”恰恰是对个人的描述,可以为每个人贴上无数标签,精细追踪个人的需求。
◆ 走向物联网与精细化生产
>> 孙正义指出:“物联网与人工智能的关系,正如同眼睛与大脑配合使生物得到进化的关系。物联网爆发即将来临。”
>> 物联网系统与传统的机器系统在知识上有根本区别,在运作逻辑上,是从机械的牛顿机器向智能的默顿机器的升华。所谓牛顿机器就是根据因果规律程序运行的机器,而默顿机器则是根据相关性思维自主学习规律的机器。牛顿机器遵循“大定律,小数据”逻辑,而默顿机器遵循“小定律,大数据”规律,不追求终极大定律,与人脑工作方式更接近,更能呼应大千世界的瞬息万变。
◆ 呼唤智能政府与智能社会
>> 未来政府的很多管理方式都有必要从追逐式管理变成预测性管理。
>> 通过社交媒体、地图、传感器和其他各类渠道自动采集社会数据,并整合各类交通、金融公开信息,打通分离的数据库,提供各种数据透视方案而无须用户编写代码。
◆ 06 冲入AI无人区:无人驾驶之路
>> 昆德拉说:“负担越重,我们的生命越贴近大地,它就越真切实在。”
◆ 曙光就在前方
>> 在今天我们已经知道,要让无人车具备敏锐的“视觉”,中间还隔着运算速度、大数据、深度学习等数不清的技术鸿沟。
◆ 老牌车企“车到山前”
>> 根据给出的定义,智能汽车的发展可以分为4个阶段:第一阶段(L1)是“高级辅助驾驶系统”,特点是为司机提供碰撞警示,紧急情况制动,盲区监测和弥补夜间行车的视力弱势。第二阶段(L2)被翻译为“特定环境的自动驾驶”,接近于通用公司的设想,车辆能在高速公路或是堵车这种相对规律的环境中自动驾驶。从第三阶段(L3)开始,我们对无人驾驶的期待有了一些轮廓,L3即为“多种环境中的自动驾驶”,车辆能适应所有路况,但在特殊情况下需要转交给人类驾驶员。到了第四阶段(L4),即“全自动驾驶”阶段,智能汽车真正做到了自主驾车。至于L3和L4的区别,从外形上看,L4智能车将在L3的基础上,撤掉方向盘和刹车。
◆ 智能企业的边缘突进
>> 百度无人车的车顶装有一台64线激光雷达,通过持续地圆周旋转,对车身60米半径内的路况进行全景扫描。车辆两端和后方分别装有3个激光雷达,用于扫描邻近区域,弥补车顶雷达的视角盲区。
◆ 苦练无人车的内功与外功
>> 在“视距”上,无人车较之裸眼具有绝对优势,驾驶员的安全视距一般在50米左右,而无人车依靠多种中远距雷达、摄像头等传感器,能实现200米以上的超视距扫描观测。
>> 人类驾驶员,从遇到紧急状况到踩下刹车需要0.6秒。而汽车的刹车要发生作用,其油压系统传导还需要0.6秒。也就是说,一般的人类驾驶员需要1.2秒的时间把车刹住。而百度无人车从“发现”紧急情况到做出刹车动作只需要0.2秒。
◆ “老司机”驶向何方
>> 车联网系统将把无人车连成整体,每辆车在行驶时“脑海中”都有着“大局观”。一辆车紧急刹车就会紧急“告知”一定范围内的无人车也做出对应的措施,从而避免追尾事故。
>> 无人车的训练中不可能允许违法行为的出现,那么它要怎样和灵活应变的人类相处,遇到实际驾驶中的模糊区域要怎样做出决策?目前仍是无人车集中攻克的一门“学科”。
◆ 人工智能让起点更公平
>> 机器人首先推门进入的就是传统金融的核心区域——信用评级。
>> 一般来说,大数据风控的成果跟传统金融机构一样也是两个名单:基于白名单的征信,基于黑名单的反欺诈。
>> 朱光曾说:“我们这个社会,究竟该由谁来给身无长物的年轻人发放第一笔贷款,在他们人生关键的爬坡阶段给予扶持?现在来看,答案也许是‘机器’。”
◆ 数据挖掘:智能投资的钥匙
>> 而真正的智能投资依然是基于数据驱动的。无论算法怎么迭代,怎么有创意,也不论逻辑关系设计得多巧妙,有了金融算法模型,还必须有大量的符合模型需求的经济、社会、特定行业变化等多维度的数据集,来验证算法模型的可行性和精准度。
>> 百度日均产生跟股票名称或股票代码直接关联的搜索量约2000万次,一只股票的搜索量和其股价走势往往呈现高度的正相关性,平均相关性达0.7以上,搜索量作为量价的补充信息,代表了某只股票被投资者关注的程度,辅助以舆情因子的判断,可以被当作潜在买家/卖家的能量积蓄,用来判断何时入场,什么时候又该进行风险规避。
◆ 智能金融的三层境界
>> 正如巴菲特所说,“投资并非一个智商为160的人,就一定能击败一个智商为130的人的游戏”。
>> 不管什么样的算法和模型,都要尊重金融规律和投资逻辑,波动不是机器投资引起的,而是市场预期变化引起的。背后做出洞察和决策的还是人,至少在我们可以预见的未来,这一点不会改变。
◆ 谁来突破产品升级的瓶颈
>> 2015年发布的《中国制造2025》行动纲要指出,“制造业是支撑我国经济社会发展的重要基石和促进世界经济发展的重要力量”“各国都在加大科技创新力度,推动三维(3D)打印、移动互联网、云计算、大数据、生物工程、新能源、新材料等领域取得新突破。基于信息物理系统的智能装备、智能工厂等智能制造正在引领制造方式变革;网络众包、协同设计、大规模个性化定制、精准供应链管理、全生命周期管理、电子商务等正在重塑产业价值链体系;可穿戴智能产品、智能家电、智能汽车等智能终端产品不断拓展制造业新领域。我国制造业转型升级、创新发展迎来重大机遇。”
◆ 迎接智能原力
>> 必须非常清晰地认识到,人工智能在短期根本不能跟人相比。而我们今天应该踏踏实实把一些应用,比如云交互、自然语言理解、计算机视觉等各种应用场景做出来。例如车载设备、可穿戴设备等。让用户觉得真正有用,而不只是在媒体上或者在电影里面讨论一下
◆ 从CTO到CAO:引领企业升级之人
>> 数据在CTO眼中可能只是技术副产品,但是在CAO眼中则是战略性资源。
◆ 首席人工智能官做什么
>> :数据—算法—知识—用户体验—新的数据,循环往复,滚雪球式前进,在这个过程中创造商业价值。这就是CAO做的事情。
◆ 没有智能官的企业将被看作旧企业
>> 机器学习不是为了证明某些原因,它的存在是为了针对一些特定的数据、行为或者是模式做出一些高质量的预测。算法唯一的工作就是让你能够更加有效、更加精确地达成目标,而不是告诉你为什么。
>> 机器学习具有根据数据反向求得函数逻辑的能力,这种反向推演能力可以给企业运作者提供一种观察企业非显性逻辑的视角。
>> 而CEO一定要放权让CAO去施展,甚至亲自推进企业第一个智能化业务。没有CEO发自内心的支持,企业人工智能化工作将会很困难。有些举措可能旁人一开始不理解其价值,之后才会明白。如果错过就会非常可惜。
◆ 首席人工智能官的修养
>> 沃尔玛的“购物篮分析”是典型的数据挖掘应用,数据分析师想到从顾客购物小票里发掘购买对象之间是否有相关性。经过数据统计,他们发现除了牛奶和面包会经常被一起购买这种显而易见的关系之外,还有很多以往没发现的关系,比如婴儿纸尿裤常常会和啤酒一起被购买,然后才发现年轻的爸爸在购买婴儿用品的同时,往往会有一种犒劳自己的心理,于是购买了啤酒。
>> 企业要做的是根据场景重新规划,打通业务,而不是根据业务来划分产品架构。
◆ 如何跨越数据的“马尔萨斯陷阱”
>> 有人专门比较了电商网站与12306网站。“双十一”时,淘宝等电商网站虽然也承接了海量人群的下单行为,但是这些单子被分布到数量巨大的商品上,彼此之间相关度很低,计算量也被服务器分摊了。火车票则不同,全国的班次就那么多,而火车票的抢购中,每一趟火车的千余个座位很可能面临数万甚至数十万人的抢购,火力极其集中。每发生一次购买行为,出票系统不但要分析该车次所有站点的数据,还要计算数十倍于车次出票数的抢票顺序数据,并实时更新沿线车站的可售票数,可以说是牵一票而动全身。数据和计算量呈几何式增长,而且一切还都要在瞬间完成,即便不计成本地投入更多服务器也难以解决。这种难题是大电商也没有遇到过的,直到后来探索出新的计算架构和方法,才得以缓解。
>> 2014年,网站安全和内容分发公司Incapsula发布了一项统计数据:56%的网页浏览量都由爬虫机器人贡献。换句话说主要的互联网用户已经不是人类。大部分点击数据都是机器程序产生的。
>> 要跨越数据世纪的“马尔萨斯陷阱”,我们需要做三件事情:一是对并发的大量数据做出即时高效处理;二是高效存储数据并删除不需要的数据;三是对积存的数据资料进行深入挖掘。
◆ “思维”倒逼“生理”革命——硬件基础设施创新
>> 人类的大脑重量只占体重的2%左右,但是消耗的能量却要占到全身消耗量的20%——每天消耗总氧气量的20%,消耗肝脏储存血糖的75%。
>> 2011年我国数据中心耗电量达700亿千瓦,占全社会耗电总量的1.5%,相当于天津市全年用电量。
>> 传统的计算机核心架构基于冯·诺依曼结构:数据存储和处理分离,计算逻辑呈线性分布。计算芯片执行指令代码,把结果存储到内存中,供下一个计算指令来调取,依次循环。
>> 一个方向是物理学的突破应用,比如令人神往的量子计算,利用量子物理学中的量子态叠加效应,创造性能百万倍于现在的计算机芯片。用光流代替电流传递数据和运算,也是提速的一个方向。另一个方向就是伴随脑科学和深度学习的兴起,有希望模仿人脑原理开发神经学芯片,其运行速度也将比现有的计算机快多个数量级。
>> 人工神经网络是模仿生物神经网络的计算架构的总称,由若干人工神经元节点互连而成,神经元之间通过突触连接。这里,每个神经元其实是一个激励函数,突触则是记录神经元间联系的强弱权值。
◆ 神经网络进化哲学
>> 病毒与反病毒软件、黑客与反黑客工作则是发生在互联网上的另一个共同进化的例子。如今机器学习已经被运用于网络安全,相比过去基于设定特征的防火墙,效率大大提高。所谓共同进化就是:不是你死我活,也不是一团和气,而是在对抗中一起升级。
>> 科学家抓住了“进化”的脆弱性本质,将错就错,把对抗看作一种训练办法,变阻碍为动力,艰难提升。大自然的进化本身就是高度脆弱的,无数生物“程序”被大自然淘汰,因为它们“出错”了。错误,就是进化的终极工具。而智慧就是在这个方生方死的过程中艰难升起。
>> 机器的进化迭代过程比大自然快亿万倍。在这种对抗生成中,机器习得的逻辑已经远远超出人类的理解,可能成为一种“黑箱”。是追求“黑箱”,还是追求“白箱”,如何避免“黑箱”带来的不可知危险,这是对人类的一个挑战。
>> 对偶网络利用这样一种精妙策略大大减少了对标注数据的依赖,我们从中可以再次洞见某种进化的哲学:进化是一种自我应答和自我循环的过程,从A到B,从B到A,互为镜像,但镜子并不清晰,各自掌握一半的秘密,没有仲裁,却可以在彼此猜测、参照中摇摇晃晃地前行。
◆ 智能时代的衣食住行
>> 技术的主要目的从来不是“替代”,而是“支持”
>> 虚拟现实使得人类不仅可以穿透语言的障碍和光线的阻挡,还可以像《黑客帝国》一样穿行于梦境和现实。
◆ 别输在人工智能起跑线上
>> 在面对“未来已来”的人工智能时,郝景芳有自己的观点:“未来的人类社会分工会更加明确,标准化的生产由人工智能完成,人类则负责那些创造性和情感性的工作,同时未来社会的组织也会更加灵活。其中最关键的一点是在人工智能主导的社会中,现在的教育模式已经无法适应变化,如果不进行改革,我们很难面对未来的人工智能时代。”
>> 人工智能如同普罗米修斯带来的礼物,既可能是启蒙的火种,也可能是伤人的烈焰,只有掌握它,才能发挥积极的作用。
◆ 工作着是美丽的,智能时代更是如此
>> 毕业生最害怕的不是低工资,不是辛苦,甚至不是找不到工作,而是发现自己所学的东西一无所用。
>> 真正决定我们职业未来的,是我们是否具备智能时代需要的职业素养。当智能工具变得越发无所不能,能否灵活使用它就成为差距所在。一个对程序编写、数据分析、机器学习一窍不通的人,就像工业时代不会使用扳手的人一样。
◆ 数字鸿沟
>> 吴军的一个说法在网上流传:智能时代只属于2%的人,其他98%的人都会成为落伍者。
◆ 人类还能做些什么
>> 很多人尚未意识到所有单一技能的职业都可能被机器代替。语音识别代替速记员的事情最近几年就会发生;现场同声传译只是因为受限于麦克风阵列硬件发展,还需要时日;电子警察比保安更有效,很多小区里摄像头车牌识别已经代替了以往的刷卡进出;电商、快递业的人工客服已经被机器取代。倒是出租车司机可能会晚一点被淘汰,无人车并不容易在10年内取代人工。
>> 那时,衣食无忧的普通人类可以实现马克思“上午狩猎,下午钓鱼,晚上研究哲学”的自由生活了吗?也许可以,但可能会缺少自由的心情,因为你不能创造价值,不被需要。人的一大基本需求就是渴望得到他人的认可。没有价值的人会进入怎样的消沉状态?或许他们会重新组成一个圈子,如同地下城一般,有一套不同于智能世界的生活方式。
◆ 工具理性之问
>> 工具将人类从“自然的暴政”下解放,但工具本身、工具与社会关系的结合,又造成新的不平等。谁垄断了工具,谁就垄断了经济政治的命脉。曾经匮乏但是平等的原始社会,因为工具,分裂为垄断“智能”的统治阶层和不拥有知识的被统治阶层。
>> 云社会和物联网提供了把实践劳动与脑力劳动结合起来的可能。
◆ 机器人的无用之用
>> 科学的一大基本特征是“对象化”——人与自己的研究对象分离,完全“客观”地观察、记录、分析对象,尽量不带入观察者自身的因素,诸如情绪、立场等。这套方法是人类认识自然世界的有力工具,但是在用于认识人类自己的时候却遇到了困难。
>> 帕里西认为,目前的机器人或者人工智能与人的区别在于,人的思维中包含了动机与认知两种模式。人的任何行为都有动机,比如为了吃喝与生存、为了安全与繁殖、为了荣誉与理想等。而现有的机器人只有认知,无所谓动机,因为它的目的是由人设定的。机器人只是工具,为了满足人的特定需要而存在。
◆ 二十三条军规
>> 在2017年1月5~8日举行的“BenificialAI 2017”会议上,1980名来自产业、学术和研究界的人工智能相关人士共同制定了“二十三条原则”,宗旨在于确保人工智能的健康发展,人人都能从人工智能中受益。这二十三条原则分为研究问题、伦理价值观和长期问题三个部分。
>> 最后一条是“共同利益”:超级智慧只应该为广泛共享的伦理理想服务,为了全人类而不是一个国家或组织的利益而发展。
◆ 现实的法律问题
>> 人工智能技术可能不只是理工专业人士的领域,法律人士以及其他治理者也需要学习人工智能知识,这对法律人士和其他治理者提出了技术要求。
>> 最好的办法还是制度与技术手段的突破,比如建立统一的数据保护平台,让个人可以了解自己的数据被政府、公司使用的状况,避免单向过度的使用。
◆ 数字权力的重新分配
>> 他说:“当我意识到,人们更愿意相信网络舆论而非现实,我发现,我拥有了让人们相信任何事物的能力。”
>> 每个现代人都被自己生产的数据包围着。智能化的数据已经成为人类的第二肉身。
>> 在未来,对数据智能的熟悉程度会影响一个人工作、生活的幸福感。做一个有准备的人,才能在数据生活中游刃有余。
◆ 新世代 新未来
>> 在日本、中国、欧美等许多发达的城市社会中,兴起了一个被称为“尼特族”的群体,主要指一群无业、在家啃老、沉迷于动漫作品的年轻人。据统计,在日本15~34岁的年龄段中尼特族数量高达60多万人,占该年龄段人口的2.2%。
>> 每当一个新时代来临,总有一部分人摩拳擦掌,一部分人随波逐流,还有一部分人茫然无措。
>> 忧思不代表悲观,也只有在忧思基础上的乐观,才是真正的乐观。想象未来是一件困难的事情,虽然未来无比诱人,值得人们为之奋斗。
◆ 后记
>> 开发流程(大数据—深度学习—提取模式—创造用户价值)和开发文化,就已带有人工智能的天然基因。
>> 如果人类进步的主旋律是通过感知和认知能力的不断提升,从而知道更多,做到更多,体验更多,那么人工智能就是这一主旋律的最新回响。
-------------------------------------------
笔记:
行业:
SLAM:
总结:
机器视觉:
图像处理:
点击在看,分享,交流学习
本文分享自微信公众号 - 涛涛CV(taotcv)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
来源:oschina
链接:https://my.oschina.net/u/4597899/blog/4444633