个性化TTS应用
智能交互、自动客服、虚拟主持人
个性化TTS数据如何解决?
专业TTS数据制作
为产品塑造独特声音形象:根据产品特点筛选符合音色的声优,高标准录制数十小时音库
数据采集:中文、英文、中英混杂
数据标注:发音校对、音素转写、音素边界切分、韵律标注、词性标注、重音标注、发音词典制作
案例:美式英语TTS数据制作
发音人:美国女声
数据量:2万句,20小时
录音环境:专业录音室,专业麦克风
标注内容:发音校对、音素转写、音素边界切分、韵律标注、重音标注、词性标注、发音词典制作
普通人TTS数据制作
用于迁移学习的个性化声音合成:根据应用场景,筛选数千普通人在录音棚或按照要求环境下录制
数据采集:中文、英文、中英混杂
数据标注:发音校对、音素转写、发音词典制作
案例:素人TTS采集
发音人:普通话
数据量:1000人,每人300句
录音环境:专业录音室,专业麦克风
标注内容:发音校对
前端模型数据制作
用于TTS前端模型的预处理:根据提供文本,进行韵律标注及多音字、数字、符号的读音标注
数据标注:多音字读音标注、数字读法标注、符号读音标注、韵律标注
案例:前端模型数据标注
200万句多音字读音标注:选择正确的拼音
100万句数字读法标注:电报读法还是序数读法
100万句符号读音标注:选择正确的读法
TTS数据:
200小时TTS普通话成人大库
1000普通人个性化语音库
20万条中文文本韵律语料库
汉语多音字语料库(10万句,100多音字)
数字读法语料库(10万句)
https://www.datatang.com/dataset/all/1
来源:CSDN
作者:数据堂官方账号
链接:https://blog.csdn.net/weixin_44532659/article/details/104316604