[语音识别] kaldi -- aidatatang_200zh脚本解析:获取对齐文件(对指定的数据进行对齐,作为新模型的输入)

Posted MachineLP

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[语音识别] kaldi -- aidatatang_200zh脚本解析:获取对齐文件(对指定的数据进行对齐,作为新模型的输入)相关的知识,希望对你有一定的参考价值。

输入:tree & final.mdl & text & L.fst & feats

输出:ali.JOB.gz (根据重新构建的图产生) & final.mdl (cp from 训练过程的最终结果)

steps/align_si.sh --cmd "$train_cmd" --nj 10 \\
  data/train data/lang exp/mono exp/mono_ali || exit 1;

流程:

1. 根据$use_graphs(默认是false)判断是否需要重新构建图
    1.1 compile-train-graphs //使用final.mdl重新构建图
2. gmm-align-compiled //对齐
3. gmm-boost-silence //模型平滑处理
4. steps/diagnostic/analyze_alignments.sh --cmd "$cmd" $lang $dir  

备注:

  1. compile-train-graphs & gmm-align-compiled
  • 输入:tree & final.mdl & text & L.fst & feats
  • 输出:ali.JOB.gz
tra="ark:utils/sym2int.pl --map-oov $oov -f 2- $lang/words.txt $sdata/JOB/text|";
$cmd JOB=1:$nj $dir/log/align.JOB.log \\
    compile-train-graphs --read-disambig-syms=$lang/phones/disambig.i

以上是关于[语音识别] kaldi -- aidatatang_200zh脚本解析:获取对齐文件(对指定的数据进行对齐,作为新模型的输入)的主要内容,如果未能解决你的问题,请参考以下文章

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

[转]Kaldi语音识别

我们基于kaldi开发的嵌入式语音识别系统升级成深度学习啦

Kaldi语音识别工具编译问题记录(踩坑记录)