Kaldi语音识别快速入门

為{幸葍}努か 提交于 2019-12-12 02:57:20

一.简介

  Kaldi是使用C++编写的语音识别工具包,Apache License v2.0许可。主要供语音识别研究人员使用。Kaldi的目标和范围与HTK类似。目标是拥有易于修改和扩展的现代而灵活的代码。主要功能包括:

  1.与有限状态传感器FST的代码进行集成,根据OpenFst工具箱【作为库】进行编译。

  2.广泛的线性代数支持,包括一个包装标准BLAS和LAPACK例程的矩阵库。

  3.可扩展的设计,以方便使用为目的提供算法。

二.安装Kaidi

  1.下载

    在Linux你要安装的目录下执行:git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream

  2.更新

    当需要更新时,可以执行:git pull

  3.安装环境

    理想的计算环境是运行在SGE【Sun GridEngine】的Linux机器的集群上,可以通过NFS或某些类似的网络文件系统访问共享目录。在理想情况下,网格上的某些计算机将具有NVidia GPU,这样可以将它们用于神经网络的训练,并且可以通过向qsub添加一些额外的选型将它们保留在队列中。在实际情况或用于学习时,可能单机是比较普遍的,在单机情况下,Kaldi是可以运行的,尽管这样做会执行的慢一点,并且可能必须要减少某些示例脚本中使用的作业数量,以免耗尽机器的内存。

  4.所需的软件包

    1.Git这是下载Kaldi及其依赖的其他软件所必须的。

    2.wget是安装某些非Kaldi组件时所必须的。

    3.示例脚本需要标准的UNIX实用程序,例如bash,perl,awk,grep和make。

 

w

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!