AI 语音对话技术
机器学习以及自然语言处理技术的进步,开启了人与人工智能进行语音交互的可能,人们透过对话的方式获取信息、与机器进行交互,将不再只是存在科幻情结当中。语音交互是未来的方向,而智能音箱则是语音交互落地的第一代产品。 一、语音交互流程简介 AI 对话所需要的技术模块有 4 个部分,分别为: 自动语音识别(Automatic Speech Recognition, ASR) 自然语言理解(Natural Language Understanding, NLU) 自然语言生成(Natural Language Generation, NLG) 文字转语音(Text to Speech, TTS) 以叮咚开发文档中的语音交互流程图来看Ai 对话技术的主要路径: 从上图中可以看到,用户与设备之间的交互,主要是采用语音方式处理和完成的。 二、语音交互流程设计 一次完整的语音交互流程,成功的语音对话,通常是有以下几个阶段。 1.交互流程的核心—意图 所谓意图,表示用户在使用应用时所做的动作(譬如:问一个问题或发送一条指令),这些意图代表了应用的核心功能。 如果应用成功地识别了用户意图,则需要在完成业务动作后,将结果反馈给用户;如果应用无法识别用户意图,则需要给用户友好的提示,指导用户使用。 用户:七星彩的开奖时间是什么时候? Ai:体育彩票七星彩每周二、周四和周日开奖。 2. 如何识别意图