从零开始玩人工智能—语音API-03
还在担心自己的英语发音不标准?请个外教教发音太贵?有语音认知服务还要啥自行车啊~ 既然放音和录音我们都尝试过了,那么来一个更有难度的实验吧。 发音评估 实际上,语音转文本的服务中,提供了一个发音评估参数。利用这个参数,就能够对发送的语音进行发音评估。很有趣吧?我们看看 Speech-to-Text REST API 是怎么说明的。 要实现发音评估功能,只需简单在提交语音转文本请求的时候,在头部header中添加 'Pronunciation-Assessment' 这个字段即可。该字段指定用于在识别结果中显示发音评分的参数,这些参数可评估语音输入的发音质量,并显示准确性、熟练、完整性等。此参数是 base64 编码的 json,其中包含多个详细参数。 和前面的内容一样,我们首先做些准备工作,首先把代码环境设置好。 import requests import pyaudio, wave import os, json, base64 from xml.etree import ElementTree # constents for WAV file CHUNK = 1024 FORMAT = pyaudio.paInt16 CHANNELS = 1 RATE = 16000 RECORD_SECONDS = 5 # speech service information