语音信号的线性预测编码(LPC)
语音信号的线性预测编码( LPC ) by Goncely 1 线性预测技术概述 线性预测编码是语音处理中的核心技术,它在语音识别、合成、编码、说话人识别等方面都得到了成功的应用。其核心思想是利用输入信号 u 和历史输出信号 s 的线性组合来估计输出序列 s(n) : 式中的 a i 和 b j 被称为预测系数,其传递函数可表示为: 该式为有理函数,在基于参数模型的谱估计法和系统辨识研究中,根据极点和零点数目的不同,它存在三种情况:一种是只有零点没有极点的情况,分母 U(z) 为单位 1 ,称为滑动平均模型,即 MA ( Moving-Average )模型;另一种是只有极点没有零点的,分子 S(z) 为常数,称为自回归模型,即 AR ( Auto-Regressive )模型;第三种是既有零点又有极点的,称为自回归滑动平均模型,即 ARMA ( Auto-Regressive Moving-Average )模型。这三种模型中对于复杂的频谱特性的描述能力最强的应该是 ARMA 模型,但它的参数估计存在许多复杂问题。全极点模型的参数估计十分简便,而且往往只需要很少几个极点就可以相当好地逼近一种频谱或一种系统的频率响应,因为它的传递函数相当于一个递归数字滤波器,即 IIR 滤波器。众所周知,用一个三四阶的 IIR 数字滤波器来逼近希望的频率响应幅度特性就可能相当于一个二十多阶的