[语音识别] kaldi -- aidatatang_200zh脚本解析:语言模型准备
Posted MachineLP
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[语音识别] kaldi -- aidatatang_200zh脚本解析:语言模型准备相关的知识,希望对你有一定的参考价值。
输入:data/local/dict
输出:data/lang (Phone Sets), (L compilation) ...
可选参数:
- --num-sil-states <number of states> (静音音素的状态数,预设是5)
- --num-nonsil-states <number of states>(非静音音素的状态数,预设是3)
- --position-dependent-phones (true|false)(是否开启音素位置标记)
- --share-silence-phones (true|false)(预设为false,如果为true 所有“silence”音素(比如静音,发声噪声和笑声)的高斯混合模型的概率密度函数都是共享的,只有这些模型之间的转移概率不同)
- --sil-prob <probability of silence> (静音的概率,预设是0.5)
- --phone-symbol-table <filename> (是否有自己提供的phone.txt)
- --unk-fst <text-fst> (是否有集外词的fst)
- --extra-word-disambig-syms <filename> (是否有额外的词级别的消歧符)
utils/prepare_lang.sh --position-dependent-phones false data/local/dict "<UNK>" data/local/lang data/lang || exi
以上是关于[语音识别] kaldi -- aidatatang_200zh脚本解析:语言模型准备的主要内容,如果未能解决你的问题,请参考以下文章