kaldi | 易学教程

[Kaldi]中应用CMVN

阅读更多关于 [Kaldi]中应用CMVN

Kaldi中应用CMVN Author: Xin Pan Date: 2020.01.14 在上一篇博客中记录了CMVN的统计量是如何被记录下来的之前的博客在这里。现在看CMVN如何应用在自己的feats上。建议各位看官先看之前的这篇文章，可以对CMVN计算代码中的各个变量有好的认识。 Kaldi中 compute-cmvn-stats 用于计算CMVN的统计量，但是并不将其应用于feats中， apply-cmvn 这个命令会将CMVN应用到feats中。 Kaldi官方对于apply-cmvn的解释 Usage 应用倒谱均值和（可选）方差标准化默认情况下为每句话，如果提供了utt2spk选项，则为每名发言者用法：apply-cmvn[选项]（|） e.g.：apply cmvn–utt2spk=ark:data/train/utt2spk scp:data/train/cmvn.scp scp:data/train/feats.scp ark:- 过程实验继续使用aishell 1 的train set 进行。实验命令如下： apply-cmvn --utt2spk = ark:data/train/utt2spk --norm-means = true --norm-vars = false scp:data/train/cmvn.scp scp:data

kaldi 中train_mono.sh分析

阅读更多关于 kaldi 中train_mono.sh分析

$cmd JOB=1 $dir/log/init.log \ gmm-init-mono $shared_phones_opt "--train-feats=$feats subset-feats --n=10 ark:- ark:-|" $lang/topo $feat_dim \ $dir/0.mdl $dir/tree || exit 1; 训练结果是生成0.mdl和tree 查看0.mdl方法 ~/williamli/project/kaldi/kaldi/src/gmmbin/gmm-copy --binary=false 0.mdl - 输出结果第一部分 <TransitionModel> <Topology> <TopologyEntry> <ForPhones> 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 显示出音素的个数，这里音素用序列号代表第二部分 <TransitionModel> <Topology> <TopologyEntry> <ForPhones> 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 <TransitionModel> <Topology> <TopologyEntry>

VMware Ubuntu Kaldi

阅读更多关于 VMware Ubuntu Kaldi

1.VMware10.0 秘钥网上搜就好了 2.ubuntu12.04 （1）安了几次14.04,16.04,12.04，最后窗口和分辨率的bug 还是没有解决（2）终端显示菱形乱码的解决：直接用英文安装（3）安装过程：新建虚拟机》空磁盘，之后进行安装》选择linux,ubuntu（之前一直是ubuntu64，最后一次安装ubuntu），处理器一个八核，》将磁盘单个文件》最后设置里选择iso 以及iso文件位置开启虚拟机》默认进行，语言不改成中文 3.kaldi （1）linux的命令 cd ..回上一级目录cd **到该目录ls显示文件夹内容cat显示文档内容sudo apt-get install安装make make -j 4 make install ：locate **定义文件夹;ctral+G ctral+Alt ctral+F1 CTRL+F7 (2)安装过程：（来自吴本谷的整理）安装前你需要对你的linux 进行配置，你需要安装的软件有： apt-get subversion automake autoconf libtool g++ zlib libatal wget 具体安装方法如下：（1）sudo apt-get install libtoo （2）sudo apt-get install autoconf （3）sudo apt-get

用 Kaldi 进行语音建模1

阅读更多关于用 Kaldi 进行语音建模1

kaldi 简介： kaldi 是到目前为止，一款非常优秀的语音识别开源建模软件。顺带一下八卦，其作者，Dan Povey 也是来到了中国发展。 kaldi 是一个建模工具，而建出来什么样的模型，完全依赖于个人。kaldi 的底层是基于 C，用户可以通过钓调用各种样例脚本进行建模。因为是开源的，所以高级玩法是可以自己修改代码编译。初级玩法是调用现有脚本进行编译。这里说的，只是初级玩法。这里参考github上的 https://github.com/kaldi-asr/kaldi ，来说明。 kaldi 建模流程概述： 1.了解脚本位置 kaldi 里面建模一般是在 egs 目录下新建自己的项目，而后在里面新建 s5，而后将其相关脚本从其他项目的 s5 中拷贝到此目录下，进行修改，如从 cp -r kaldi/egs/wsj/s5 egs/test/ 拷贝之后，删除部分不相关数据，如 data， exp，mfcc 中的数据，只保留空文件夹。kaldi/egs/wsj/s5里面比较干净，所以只要新建这三个文件夹即可。其中data里面是待建模数据，exp里面是建模后的模型，mfcc是中间提取的特征。conf里面是配置参数。 2.音频数据准备在data目录下面，一般是新建 train 和 test 两个文件夹，里面放的分别是建模训练数据和测试数据。其实

Kaldi语音识别快速入门

阅读更多关于 Kaldi语音识别快速入门

一.简介　　Kaldi是使用C++编写的语音识别工具包，Apache License v2.0许可。主要供语音识别研究人员使用。Kaldi的目标和范围与HTK类似。目标是拥有易于修改和扩展的现代而灵活的代码。主要功能包括：　　1.与有限状态传感器FST的代码进行集成，根据OpenFst工具箱【作为库】进行编译。　　2.广泛的线性代数支持，包括一个包装标准BLAS和LAPACK例程的矩阵库。　　3.可扩展的设计，以方便使用为目的提供算法。二.安装Kaidi 　　1.下载　　　　在Linux你要安装的目录下执行：git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream 　　2.更新　　　　当需要更新时，可以执行：git pull 　　3.安装环境　　　　理想的计算环境是运行在SGE【Sun GridEngine】的Linux机器的集群上，可以通过NFS或某些类似的网络文件系统访问共享目录。在理想情况下，网格上的某些计算机将具有NVidia GPU，这样可以将它们用于神经网络的训练，并且可以通过向qsub添加一些额外的选型将它们保留在队列中。在实际情况或用于学习时，可能单机是比较普遍的，在单机情况下，Kaldi是可以运行的，尽管这样做会执行的慢一点

语音信号处理Kaldi ToolKit 和VoiceBox

阅读更多关于语音信号处理Kaldi ToolKit 和VoiceBox

1. Ubuntu上安装Kaldi ToolKit 安装git i) git --version ii) sudo apt install git iii) git –version : 2.7.4 ix) git config --global user.name “git” x) git config --global user.email zhaodpx@163.com xi) git config --list xii) git init xiii) git init newrepo 安装Kaldi Toolkit 主要参考： http://kaldi-asr.org/doc/install.html Git主页： https://github.com/tzyll/kaldi git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream 下载后，所需操作为： http://kaldi-asr.org/doc/tutorial_setup.html cd kaldi/tools/; make; cd ../src; ./configure; make 第一步：cd kaldi/tools/ 第二步：make，显示： zhaodeng@ubuntu:~/kaldi/tools$ make

Kaldi toolkit Installation Error on Ubuntu 16.04

阅读更多关于 Kaldi toolkit Installation Error on Ubuntu 16.04

Hi I am trying to install Kaldi toolkit for speech recognition on Ubuntu 16.04. I have followed instructions in INSTALL file. (1) go to tools/ and follow INSTALL instructions there. Followed procedure in INSTALL file in tools and got following output, $ extras/check_dependencies.sh ../tools/extras/check_dependencies.sh: all OK. and executed make without any errors. Here are last few lines in case if you want to take a look $ make rm -f openfst ln -s openfst-1.6.1 openfst Warning: IRSTLM is not installed by default anymore. If you need IRSTLM Warning: use the script extras/install_irstlm.sh All

Spectrograms generated using Librosa don't look consistent with Kaldi?

阅读更多关于 Spectrograms generated using Librosa don't look consistent with Kaldi?

问题 I generated spectrogram of a "seven" utterance using the "egs/tidigits" code from Kaldi, using 23 bins, 20kHz sampling rate, 25ms window, and 10ms shift. Spectrogram appears as below visualized via MATLAB imagesc function: I am experimenting with using Librosa as an alternative to Kaldi. I set up my code as below using the same number of bins, sampling rate, and window length / shift as above. time_series, sample_rate = librosa.core.load("7a.wav",sr=20000) spectrogram = librosa.feature

Spectrograms generated using Librosa don't look consistent with Kaldi?

阅读更多关于 Spectrograms generated using Librosa don't look consistent with Kaldi?

I generated spectrogram of a "seven" utterance using the "egs/tidigits" code from Kaldi, using 23 bins, 20kHz sampling rate, 25ms window, and 10ms shift. Spectrogram appears as below visualized via MATLAB imagesc function: I am experimenting with using Librosa as an alternative to Kaldi. I set up my code as below using the same number of bins, sampling rate, and window length / shift as above. time_series, sample_rate = librosa.core.load("7a.wav",sr=20000) spectrogram = librosa.feature.melspectrogram(time_series, sr=20000, n_mels=23, n_fft=500, hop_length=200) log_S = librosa.core.logamplitude

Kaldi安装

阅读更多关于 Kaldi安装

Kaldi是基于C++开发并遵守Apache License v2.0的一款语音识别工具包，是目前最流行的ASR工具之一，本文基于Ubuntu 18.04 LTS介绍了如何安装Kaldi。首先按照官网提示，将Kaldi项目克隆至本地: ~$ git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden 进入kaldi-trunk: ~$ cd kaldi-trunk ~/kaldi-trunk$ 查看INSTALL: ~/kaldi-trunk$ cat INSTALL This is the official Kaldi INSTALL. Look also at INSTALL.md for the git mirror installation. [for native Windows install, see windows/INSTALL] (1) go to tools/ and follow INSTALL instructions there. (2) go to src/ and follow INSTALL instructions there. 所以先进入tools目录按提示安装，再进入src目录按提示安装。进入tools目录查看INSTALL: ~/kaldi

订阅 kaldi