[语音识别] kaldi -- aidatatang_200zh脚本解析:提取特征

Posted 2021-08-13 MachineLP

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了[语音识别] kaldi -- aidatatang_200zh脚本解析:提取特征相关的知识，希望对你有一定的参考价值。

输入：wav.scp

输出：[1]: data/{train,test,dev}/{feats,cmvn}.scp [2]: mfcc/raw_mfcc_{train,test,dev}.{1,2,..10}.{ark,scp} [3]: mfcc/cmvn_{train,test,dev}.{ark,scp}

可选参数：

--mfcc-config <mfcc-config-file> default=conf/mfcc.conf，mfcc特征提取相关参数的配置（compute-mfcc-feats）
--pitch-config <pitch-config-file> 提取pitch特征相关参数的配置（compute-kaldi-pitch-feats）
--pitch-postprocess-config <postprocess-config-file> （process-kaldi-pitch-feats）相关参数的配置
--paste-length-tolerance <tolerance> fefault=2
--nj：并行任务数量（开启的线程数）
--cmd：运行方式
--write-utt2num-frames: default=true，每个音频utterance对应的帧数
--write-utt2dur：default=true，每个音频utterance对应的时长duration

for x in train dev test; do
  steps/make_mfcc_pitch.sh --write_utt2dur false --write_utt2num_frames false --cmd "$tr

以上是关于[语音识别] kaldi -- aidatatang_200zh脚本解析:提取特征的主要内容，如果未能解决你的问题，请参考以下文章