[语音识别] kaldi -- aidatatang_200zh脚本解析:获取对齐文件(对指定的数据进行对齐,作为新模型的输入)
Posted MachineLP
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[语音识别] kaldi -- aidatatang_200zh脚本解析:获取对齐文件(对指定的数据进行对齐,作为新模型的输入)相关的知识,希望对你有一定的参考价值。
输入:tree & final.mdl & text & L.fst & feats
输出:ali.JOB.gz (根据重新构建的图产生) & final.mdl (cp from 训练过程的最终结果)
steps/align_si.sh --cmd "$train_cmd" --nj 10 \\
data/train data/lang exp/mono exp/mono_ali || exit 1;
流程:
1. 根据$use_graphs(默认是false)判断是否需要重新构建图
1.1 compile-train-graphs //使用final.mdl重新构建图
2. gmm-align-compiled //对齐
3. gmm-boost-silence //模型平滑处理
4. steps/diagnostic/analyze_alignments.sh --cmd "$cmd" $lang $dir
备注:
- compile-train-graphs & gmm-align-compiled
- 输入:tree & final.mdl & text & L.fst & feats
- 输出:ali.JOB.gz
tra="ark:utils/sym2int.pl --map-oov $oov -f 2- $lang/words.txt $sdata/JOB/text|";
$cmd JOB=1:$nj $dir/log/align.JOB.log \\
compile-train-graphs --read-disambig-syms=$lang/phones/disambig.i
以上是关于[语音识别] kaldi -- aidatatang_200zh脚本解析:获取对齐文件(对指定的数据进行对齐,作为新模型的输入)的主要内容,如果未能解决你的问题,请参考以下文章