语音信号的时域处理(二)
通过短时时域处理技术,可获得语音信号的相关特性。今天,介绍如何利用短时自相关函数提取语音信号中的基音。 那么,什么是基音呢?声带每开启和闭合一次的时间称音调周期或基音周期,其倒数称为基音频率,简称基音。基音与个人声带的长短、薄厚、韧性、劲度和发音习惯等有关,在很大程度上反应了个人的特征。此外,基音还随人的性别、年龄而定,老年男性偏低(约50Hz),小孩和青年女性偏高(约450Hz)。基音主要应用于低码率语音编码、语音分析与合成、语音识别和说话人识别等,在语音信号领域占据非常重要的地位。 短时自相关函数公式: 短时自相关函数具有一些特点: 1)当k取0时,函数为最大值,此时自相关函数的取值就是该信号的短时能量(参见之前的文章); 2)如果原序列是周期为T的周期信号,那么自相关函数也是周期为T的周期函数。利用该特点,可以计算语音信号里的基音。 举个栗子: 上图是基于44100Hz采样率采集的时长为0.9秒的语音信号,设帧长为1200,帧移为600,取红框内(人声部分)的一帧,如下图所示。 图(a) 人声部分的某一帧 图(b) 该帧的自相关函数 由上图(b)所示,除去第一个最大值后(0处),最大值在k= 236处,那么该帧对应的基音频率为: 除此之外,短时自相关函数还可以用来进行端点检测,判断一个语音是浊音还是清音等。好了,今天的内容就讲这么多,下期见! 来源: CSDN 作者: