百度大脑大升级:各种算法并驾齐驱
导读 百度大脑大升级:语音、视觉、语言与知识 AI 算法创新并驾齐驱 7 月 3 日下午,「Baidu Create 2019」百度 AI 开发者大会百度大脑论坛如期举行。在上午主论坛中,百度首席技术官王海峰正式发布百度大脑 5.0,实现了历史上最具跨越性升级,在算法突破、计算架构升级的基础上,实现 AI 算法、计算架构和应用场景的融合创新,成为软硬一体 AI 大生产平台。 百度AI开发者大会 重磅升级后的百度大脑 5.0 打通了从基础层的深度学习技术到通用 AI 能力、应用技术方案,再到定制化模型,以及最终的部署和集成,整个人工智能产业化应用落地的全部流程,实现了 AI 技术的标准化、自动化和模块化。 一直引领行业创新的百度大脑语音技术此次亮出在语音识别、语音合成、远场语音交互芯片方面的成绩单。百度语音技术部高级总监高亮介绍,识别方面,百度提出流式多级的截断注意力模型 SMLTA,这是国际上首次实现局部注意力建模超越整句的注意力模型,也是国际上首次实现在线语音大规模使用注意力模型。SMLTA 在大幅提升识别速度的同时,也提高了识别准确率。在输入法有效产品相对准确率提升 15%,音箱有效产品相对准确率提升 20%。合成方面,针对现阶段面临风格迁移、音色模拟和情感拟人的三大挑战,百度推出语音合成技术 Meitron,可以将语音中的音色、风格、情感等要素映射到不同的子空间,在使用时