语音特征提取
原英文博客地址: https://haythamfayek.com/2016/04/21/speech-processing-for-machine-learning.html 目录 Setup 预加重(Pre-Emphasis) 分帧(Framing) 加窗(Window) 傅里叶变换和功率谱(Fourier-Transform and Power Spectrum) Filter Banks 梅尔倒谱系数 Mel-frequency Cepstral Coefficients (MFCCs) 均值归一化 Mean Normalization Filter Banks vs MFCCs Conclusion 语音处理在自动语音识别(Automatic Speech Recognition ,简称ASR)或者说话人识别(speaker recognition)等系统中扮演了重要的角色。一直以来梅尔频率倒谱系数( Mel-Frequency Cepstral Coefficients ,简称MFCCs)在语音特征处理中很流行,最近则filter banks越来越流行了。在这边博客中讨论filter banks 和MFCCs,以及为什么filter bank会越来越受欢迎。 Filter banks和MFCCs的计算包含了一些相同的步骤,filter banks计算完成后