周五之后,AI风起,云天变

元气小坏坏 提交于 2019-11-28 19:46:52

  上周五,华为“周五见”达成了刷屏级的效果。

  其实一直关注我们的朋友,或许在此之前就不难推测出,华为如此郑重的“周五之约“,应该是要发布去年HC大会中已经披露定位和规格的昇腾910芯片。

  果不其然,华为轮值董事长徐直军在上周五发布了这款属于Ascend-max系列、号称地表最强算力的AI芯片。一时间关于AI、关系芯片的话题又重回大众视野,提振了社会心气。

  

 

  对于昇腾910这个名字,AI爱好者可能已经不再陌生,那么我们接下来的问题或许应该是,“周五”之后怎样?换句话说,大家都已经从各种信息渠道了解到,这此发布的昇腾910是华为的AI大招,目前世界上最大算力的AI芯片。

  但或许大家会好奇,这个大招对产业,对你我有什么价值?它的能力将如何投放给广阔的企业智能市场需求?

  所以在“后周五时代”,或许有必要进入昇腾910背后,窥探这片多米诺骨牌的释放,可能会在AI与计算产业中引发连锁反应。首当其冲受到影响的,必然是公有云市场。

  昇腾910落地后,AI之风正向何处奔涌,云计算产业会荡起哪些涟漪?这是一个值得花费我们更多时间来思考的话题。

  云与AI之变

  了解昇腾910的产业价值之前,我们必须回顾云计算产业近几年在遭遇怎样的变化。

  我们知道,从2012年到2018年,全球AI算力的需求增长了30万倍。而今天随着AI算力从科研与开发走向产业应用,这个曲线更加笔直地向上攀升。

  深度学习为代表的第三次AI崛起,基础技术逻辑是以某一目标训练算法模型,然后进行推理部署,达成所期待的耦合效果。

  这就意味AI应用的流程包括训练和推理两大部分。企业想要获取AI技术,要么自己训练,要么使用厂商提供已训练好的AI能力。

  而无论是AI的训练、开发,还是能力调用、场景部署,都是建立在计算基础上的。而且AI任务本身需求大吞吐量、高并发、高延展性的算力,所以云计算是AI效率最高、贴合方式最紧密的主要算力提供方案。

  这一点带给云计算产业本身以非常强大的变化。过去云计算的价值,更多是对已有互联网任务进行支撑,而现在云计算成为了获取AI能力、开发AI能力的主要载体。从“支撑”到“获取”,这完全改变了公有云对于客户和市场的价值。

  于是我们看到,AI开始作为云计算厂商的主要增长点。今天全球云计算市场的主要趋势,是传统老大哥AWS正在增速放缓,今年第二季度其增速有史以来第一次低于40%。而从去年开始大规模重组整合,以一系列AI能力、AI工具,以及部署灵活性为卖点的微软Azure,异军突起以极快的速度成为第二,云+AI成为了微软最赚钱的生意。为了继续巩固这一优势,不久前微软十亿美元投资了OpenAI,意在与谷歌持续竞争未来的AI市场。

  而以AI算法能力著称,坐拥TPU和TensorFlow框架的谷歌云成为第三,今年谷歌预计在云计算业务营收超过80亿美金,这将成为谷歌体系的最重要增长点。

  而在国内市场,以AI技术著称的百度云、华为云成为了崛起最快的两朵云。不难看出的是,全球公有云市场中,AI正在成为当之无愧的王牌。AI能力的强弱,也在成为云增长的核心能力标准。

  那么什么是云+AI的核心能力呢?

  从欧美云巨头的发展轨迹看,专项AI算力、框架、能力、开发生态是构成云服务商与企业AI需求结合的四大联接点。

  而其中算力与框架,又是整个体系的支撑,是让用户可以自行研发AI模型的基础,价值格外重要。比如谷歌云这两年的快速增长,其实是以其自研的训练用AI芯片TPU为核心战略,再将开发社区和TensoFlow的用户捆绑到自己的云服务中,达成短期快速增长。

  而为了应对谷歌树立的AI开发者之墙,微软、Facebook等巨头联手打通旗下开发框架,并发布了ONNX等跨框架工具。

  由此可见,专项训练AI算力和开发框架,是如今构筑云计算企业未来增长点的核心。而华为发布昇腾910以及自研框架MindSpore,最直接受惠的当然就是直接应用其价值的华为云。由于业界其他云计算厂商都使用英伟达的板卡作为AI算力来源,所以华为云即将成为谷歌云之外,唯一拥有自研训练芯片和自研框架的云服务厂商。

  这意味着芯片和框架这场云+AI的国际顶层竞争里,加入了华为云的坐席。而华为云在昇腾310和边端场景的应用布局,甚至构成了比谷歌云更加完整的全栈AI能力。这一信息背后,预示着此刻已经风起云涌的云计算产业,必将更加不平静。

  在明晰了云+AI的产业格局之后,我们需要换个角度,从企业用户的视角看看,昇腾910与华为云的结合,到底将带来什么价值。

  针对AI训练的暴力计算,是不可或缺的产业基石

  对于AI技术的应用者来说,AI分为两个部分,也就是大家熟知的训练和推理。这二者之间的关系就像培养一个人。训练就像上学接受教育,推理就是开始找工作。

  每个人都知道,换下工作比较容易,学校教育上个若干年可就成本很高了。不仅是要磨练学生,更是考验家长和老师。对于AI来说也是如此,企业用户应用AI能力并不难,但是想要自己训练一个专属的深度学习模型,把AI变成自己的专有竞争力,那可就困难了。

  其中最困难的一项,就是训练专项算力不足。我们曾经采访过一位科研界的朋友,他设计了一个深度学习应用于生物医疗领域的算法模型。但是用研究所采购的专项算力,申请一次四个月,训练一次两个月,出了错误就重来。这种算力情况,直接导致他到毕业也不可能完成研发。

  大型深度学习模型训练,是耗时、耗能、消耗算力最大的AI开发环节,但这一环节也是AI开发与创新的基础。如果企业用户和开发者不能独立训练大型模型,那么AI将永远停留在表层应用,无法产生差异化创新与深度结合行业的应用。

  而解决方案也很简单,用徐直军的描述,就是对AI训练进行暴力计算。只用当AI算力强到一定程度,用不讲道理的姿态碾压数据训练,AI才能真正被千行万业应用,成为众智创新的新高地。

  目前来看,昇腾910芯片就符合“暴力不讲道理”的这个芯片“人设”。根据公布数据,测试结果表明昇腾910算力达到了半精度 (FP16): 256 Tera-FLOPS;整数精度 (INT8) : 512 Tera-OPS。并且合规算力所需功耗仅有310W。更直接的对比是,运用在实际AI训练任务中,在典型的ResNet-50 网络的训练中,昇腾910与MindSpore配合,与现有主流训练单卡配合TensorFlow相比,显示出接近2倍的性能提升,每秒训练的图片数量从965张提升到1802张。

  或许我们可以说得更直白一点,华为所指的主流训练单卡,就是英伟达的V100。事实上,目前能够基于云服务获取的AI训练算力,只能来自谷歌的TPU和英伟达的V100。后者基本要通过亚马逊的AWS来获取。而根据英伟达方面的指摘,TPU2.0仅有V100二分之一的算力,并且限量出租。

  于是我们能看到,基于云服务的AI训练算力是十足的稀缺资源,价格昂贵且难以预约。这样的产业条件,显然是无法促进AI行业真正向前发展的。

  而现在,昇腾910部署到华为云之后,全球开发者拥有了第三个选择,中国公有云市场迎来了首个全栈云+AI解决方案。加之昇腾910算力比V100更强,华为云始终坚持普惠定价策略和充足能力供给,训练这个天梯,或许真正能够拥抱算力层的解决方案。

  云服务+AI训练算力,是一颗名副其实的产业基柱。但是通往这个基柱的走廊,过去非常狭窄——企业和开发者要忍受各种成本限制,当昇腾910接入华为云,这个走廊瞬间被拓宽,甚至打开了一条全新通衢。

  大连妇科医院 mobile.bhyy0411.com

  大连人流医院 mobile.bhyy0411.com

  从广泛布局企业EI,到昇腾310和ModelArts的应用与生态建设,直到今天迎来昇腾910和MindSpore,华为云的产业智能化赋能能力,也迎来了质的提升。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!