[语音识别] kaldi -- aidatatang_200zh脚本解析:提取特征
Posted MachineLP
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[语音识别] kaldi -- aidatatang_200zh脚本解析:提取特征相关的知识,希望对你有一定的参考价值。
输入:wav.scp
输出:[1]: data/{train,test,dev}/{feats,cmvn}.scp [2]: mfcc/raw_mfcc_{train,test,dev}.{1,2,..10}.{ark,scp} [3]: mfcc/cmvn_{train,test,dev}.{ark,scp}
可选参数:
- --mfcc-config <mfcc-config-file> default=conf/mfcc.conf,mfcc特征提取相关参数的配置(compute-mfcc-feats)
- --pitch-config <pitch-config-file> 提取pitch特征相关参数的配置(compute-kaldi-pitch-feats)
- --pitch-postprocess-config <postprocess-config-file> (process-kaldi-pitch-feats)相关参数的配置
- --paste-length-tolerance <tolerance> fefault=2
- --nj:并行任务数量(开启的线程数)
- --cmd:运行方式
- --write-utt2num-frames: default=true,每个音频utterance对应的帧数
- --write-utt2dur:default=true,每个音频utterance对应的时长duration
for x in train dev test; do
steps/make_mfcc_pitch.sh --write_utt2dur false --write_utt2num_frames false --cmd "$tr
以上是关于[语音识别] kaldi -- aidatatang_200zh脚本解析:提取特征的主要内容,如果未能解决你的问题,请参考以下文章