[语音识别] kaldi -- aidatatang_200zh脚本解析:语言模型准备

Posted MachineLP

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[语音识别] kaldi -- aidatatang_200zh脚本解析:语言模型准备相关的知识,希望对你有一定的参考价值。

输入:data/local/dict

输出:data/lang (Phone Sets), (L compilation) ...

可选参数:

  • --num-sil-states <number of states> (静音音素的状态数,预设是5)
  • --num-nonsil-states <number of states>(非静音音素的状态数,预设是3)
  • --position-dependent-phones (true|false)(是否开启音素位置标记)
  • --share-silence-phones (true|false)(预设为false,如果为true 所有“silence”音素(比如静音,发声噪声和笑声)的高斯混合模型的概率密度函数都是共享的,只有这些模型之间的转移概率不同)
  • --sil-prob <probability of silence> (静音的概率,预设是0.5)
  • --phone-symbol-table <filename> (是否有自己提供的phone.txt)
  • --unk-fst <text-fst> (是否有集外词的fst)
  • --extra-word-disambig-syms <filename> (是否有额外的词级别的消歧符)
utils/prepare_lang.sh --position-dependent-phones false data/local/dict "<UNK>" data/local/lang data/lang || exi

以上是关于[语音识别] kaldi -- aidatatang_200zh脚本解析:语言模型准备的主要内容,如果未能解决你的问题,请参考以下文章

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

[转]Kaldi语音识别

我们基于kaldi开发的嵌入式语音识别系统升级成深度学习啦

Kaldi语音识别工具编译问题记录(踩坑记录)