kaldi

[Kaldi]中应用CMVN

不想你离开。 提交于 2020-01-14 23:29:24
Kaldi中应用CMVN Author: Xin Pan Date: 2020.01.14 在上一篇博客中记录了CMVN的统计量是如何被记录下来的 之前的博客在这里 。现在看CMVN如何应用在自己的feats上。 建议各位看官先看之前的这篇文章,可以对CMVN计算代码中的各个变量有好的认识。 Kaldi中 compute-cmvn-stats 用于计算CMVN的统计量,但是并不将其应用于feats中, apply-cmvn 这个命令会将CMVN应用到feats中。 Kaldi官方对于apply-cmvn的解释 Usage 应用倒谱均值和(可选)方差标准化默认情况下为每句话,如果提供了utt2spk选项,则为每名发言者 用法:apply-cmvn[选项](|) e.g.:apply cmvn–utt2spk=ark:data/train/utt2spk scp:data/train/cmvn.scp scp:data/train/feats.scp ark:- 过程 实验继续使用aishell 1 的train set 进行。实验命令如下: apply-cmvn --utt2spk = ark:data/train/utt2spk --norm-means = true --norm-vars = false scp:data/train/cmvn.scp scp:data

kaldi 中train_mono.sh分析

烂漫一生 提交于 2020-01-04 03:14:29
$cmd JOB=1 $dir/log/init.log \ gmm-init-mono $shared_phones_opt "--train-feats=$feats subset-feats --n=10 ark:- ark:-|" $lang/topo $feat_dim \ $dir/0.mdl $dir/tree || exit 1; 训练结果是生成0.mdl和tree 查看0.mdl方法 ~/williamli/project/kaldi/kaldi/src/gmmbin/gmm-copy --binary=false 0.mdl - 输出结果 第一部分 <TransitionModel> <Topology> <TopologyEntry> <ForPhones> 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 显示出音素的个数,这里音素用序列号代表 第二部分 <TransitionModel> <Topology> <TopologyEntry> <ForPhones> 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 <TransitionModel> <Topology> <TopologyEntry>

VMware Ubuntu Kaldi

爷,独闯天下 提交于 2019-12-24 03:34:53
1.VMware10.0 秘钥网上搜就好了 2.ubuntu12.04 (1)安了几次14.04,16.04,12.04,最后窗口和分辨率的bug 还是没有解决 (2)终端显示菱形乱码的解决:直接用英文安装 (3)安装过程:新建虚拟机》空磁盘,之后进行安装》选择linux,ubuntu(之前一直是ubuntu64,最后一次安装ubuntu),处理器一个八核,》将磁盘单个文件》最后设置里选择iso 以及iso文件位置 开启虚拟机》默认进行,语言不改成中文 3.kaldi (1)linux的命令 cd ..回上一级目录cd **到该目录ls显示文件夹内容cat显示文档内容sudo apt-get install安装make make -j 4 make install :locate **定义文件夹;ctral+G ctral+Alt ctral+F1 CTRL+F7 (2)安装过程:(来自吴本谷的整理) 安装前你需要对你的linux 进行配置,你需要安装的软件有: apt-get subversion automake autoconf libtool g++ zlib libatal wget 具体安装方法如下: (1)sudo apt-get install libtoo (2)sudo apt-get install autoconf (3)sudo apt-get

用 Kaldi 进行语音建模1

自古美人都是妖i 提交于 2019-12-23 17:54:38
kaldi 简介: kaldi 是到目前为止,一款非常优秀的语音识别 开源 建模软件。顺带一下八卦,其作者,Dan Povey 也是来到了中国发展。 kaldi 是一个建模工具,而建出来什么样的模型,完全依赖于个人。kaldi 的底层是基于 C,用户可以通过钓调用各种样例脚本进行建模。因为是开源的,所以高级玩法是可以自己修改代码编译。初级玩法是调用现有脚本进行编译。这里说的,只是初级玩法。 这里参考github上的 https://github.com/kaldi-asr/kaldi ,来说明。 kaldi 建模流程概述: 1.了解脚本位置 kaldi 里面建模一般是在 egs 目录下新建自己的项目,而后在里面新建 s5,而后将其相关脚本从其他项目的 s5 中拷贝到此目录下,进行修改,如从 cp -r kaldi/egs/wsj/s5 egs/test/ 拷贝之后,删除部分不相关数据,如 data, exp,mfcc 中的数据,只保留空文件夹。kaldi/egs/wsj/s5里面比较干净,所以只要新建这三个文件夹即可。其中data里面是待建模数据,exp里面是建模后的模型,mfcc是中间提取的特征。conf里面是配置参数。 2.音频数据准备 在data目录下面,一般是新建 train 和 test 两个文件夹,里面放的分别是建模训练数据和测试数据。其实

Kaldi语音识别快速入门

為{幸葍}努か 提交于 2019-12-12 02:57:20
一.简介   Kaldi是使用C++编写的语音识别工具包,Apache License v2.0许可。主要供语音识别研究人员使用。Kaldi的目标和范围与HTK类似。目标是拥有易于修改和扩展的现代而灵活的代码。主要功能包括:   1.与有限状态传感器FST的代码进行集成,根据OpenFst工具箱【作为库】进行编译。   2.广泛的线性代数支持,包括一个包装标准BLAS和LAPACK例程的矩阵库。   3.可扩展的设计,以方便使用为目的提供算法。 二.安装Kaidi   1.下载     在Linux你要安装的目录下执行:git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream   2.更新     当需要更新时,可以执行:git pull   3.安装环境     理想的计算环境是运行在SGE【Sun GridEngine】的Linux机器的集群上,可以通过NFS或某些类似的网络文件系统访问共享目录。在理想情况下,网格上的某些计算机将具有NVidia GPU,这样可以将它们用于神经网络的训练,并且可以通过向qsub添加一些额外的选型将它们保留在队列中。在实际情况或用于学习时,可能单机是比较普遍的,在单机情况下,Kaldi是可以运行的,尽管这样做会执行的慢一点

语音信号处理Kaldi ToolKit 和VoiceBox

耗尽温柔 提交于 2019-12-10 15:59:13
1. Ubuntu上安装Kaldi ToolKit 安装git i) git --version ii) sudo apt install git iii) git –version : 2.7.4 ix) git config --global user.name “git” x) git config --global user.email zhaodpx@163.com xi) git config --list xii) git init xiii) git init newrepo 安装Kaldi Toolkit 主要参考: http://kaldi-asr.org/doc/install.html Git主页: https://github.com/tzyll/kaldi git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream 下载后,所需操作为: http://kaldi-asr.org/doc/tutorial_setup.html cd kaldi/tools/; make; cd ../src; ./configure; make 第一步:cd kaldi/tools/ 第二步:make,显示: zhaodeng@ubuntu:~/kaldi/tools$ make

Kaldi toolkit Installation Error on Ubuntu 16.04

你离开我真会死。 提交于 2019-12-08 06:22:24
Hi I am trying to install Kaldi toolkit for speech recognition on Ubuntu 16.04. I have followed instructions in INSTALL file. (1) go to tools/ and follow INSTALL instructions there. Followed procedure in INSTALL file in tools and got following output, $ extras/check_dependencies.sh ../tools/extras/check_dependencies.sh: all OK. and executed make without any errors. Here are last few lines in case if you want to take a look $ make rm -f openfst ln -s openfst-1.6.1 openfst Warning: IRSTLM is not installed by default anymore. If you need IRSTLM Warning: use the script extras/install_irstlm.sh All

Spectrograms generated using Librosa don't look consistent with Kaldi?

橙三吉。 提交于 2019-12-07 19:30:22
问题 I generated spectrogram of a "seven" utterance using the "egs/tidigits" code from Kaldi, using 23 bins, 20kHz sampling rate, 25ms window, and 10ms shift. Spectrogram appears as below visualized via MATLAB imagesc function: I am experimenting with using Librosa as an alternative to Kaldi. I set up my code as below using the same number of bins, sampling rate, and window length / shift as above. time_series, sample_rate = librosa.core.load("7a.wav",sr=20000) spectrogram = librosa.feature

Spectrograms generated using Librosa don't look consistent with Kaldi?

点点圈 提交于 2019-12-06 12:59:27
I generated spectrogram of a "seven" utterance using the "egs/tidigits" code from Kaldi, using 23 bins, 20kHz sampling rate, 25ms window, and 10ms shift. Spectrogram appears as below visualized via MATLAB imagesc function: I am experimenting with using Librosa as an alternative to Kaldi. I set up my code as below using the same number of bins, sampling rate, and window length / shift as above. time_series, sample_rate = librosa.core.load("7a.wav",sr=20000) spectrogram = librosa.feature.melspectrogram(time_series, sr=20000, n_mels=23, n_fft=500, hop_length=200) log_S = librosa.core.logamplitude

Kaldi安装

非 Y 不嫁゛ 提交于 2019-12-03 15:54:00
Kaldi是基于C++开发并遵守Apache License v2.0的一款语音识别工具包,是目前最流行的ASR工具之一,本文基于Ubuntu 18.04 LTS介绍了如何安装Kaldi。 首先按照 官网 提示,将Kaldi项目克隆至本地: ~$ git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden 进入kaldi-trunk: ~$ cd kaldi-trunk ~/kaldi-trunk$ 查看INSTALL: ~/kaldi-trunk$ cat INSTALL This is the official Kaldi INSTALL. Look also at INSTALL.md for the git mirror installation. [for native Windows install, see windows/INSTALL] (1) go to tools/ and follow INSTALL instructions there. (2) go to src/ and follow INSTALL instructions there. 所以先进入tools目录按提示安装,再进入src目录按提示安装。 进入tools目录查看INSTALL: ~/kaldi