Kaldi语音识别快速入门

一.简介

　　Kaldi是使用C++编写的语音识别工具包，Apache License v2.0许可。主要供语音识别研究人员使用。Kaldi的目标和范围与HTK类似。目标是拥有易于修改和扩展的现代而灵活的代码。主要功能包括：

　　1.与有限状态传感器FST的代码进行集成，根据OpenFst工具箱【作为库】进行编译。

　　2.广泛的线性代数支持，包括一个包装标准BLAS和LAPACK例程的矩阵库。

　　3.可扩展的设计，以方便使用为目的提供算法。

二.安装Kaidi

　　1.下载

　　　　在Linux你要安装的目录下执行：git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream

　　2.更新

　　　　当需要更新时，可以执行：git pull

　　3.安装环境

　　　　理想的计算环境是运行在SGE【Sun GridEngine】的Linux机器的集群上，可以通过NFS或某些类似的网络文件系统访问共享目录。在理想情况下，网格上的某些计算机将具有NVidia GPU，这样可以将它们用于神经网络的训练，并且可以通过向qsub添加一些额外的选型将它们保留在队列中。在实际情况或用于学习时，可能单机是比较普遍的，在单机情况下，Kaldi是可以运行的，尽管这样做会执行的慢一点，并且可能必须要减少某些示例脚本中使用的作业数量，以免耗尽机器的内存。

　　4.所需的软件包

　　　　1.Git这是下载Kaldi及其依赖的其他软件所必须的。

　　　　2.wget是安装某些非Kaldi组件时所必须的。

　　　　3.示例脚本需要标准的UNIX实用程序，例如bash，perl，awk，grep和make。

来源：https://www.cnblogs.com/yszd/p/12024505.html

标签

语音识别

kaldi

kaldi语音识别