[语音识别] kaldi -- aidatatang_200zh脚本解析:提取特征

Posted MachineLP

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[语音识别] kaldi -- aidatatang_200zh脚本解析:提取特征相关的知识,希望对你有一定的参考价值。

输入:wav.scp

输出:[1]: data/{train,test,dev}/{feats,cmvn}.scp [2]: mfcc/raw_mfcc_{train,test,dev}.{1,2,..10}.{ark,scp} [3]: mfcc/cmvn_{train,test,dev}.{ark,scp}

可选参数:

  • --mfcc-config <mfcc-config-file> default=conf/mfcc.conf,mfcc特征提取相关参数的配置(compute-mfcc-feats)
  • --pitch-config <pitch-config-file> 提取pitch特征相关参数的配置(compute-kaldi-pitch-feats)
  • --pitch-postprocess-config <postprocess-config-file> (process-kaldi-pitch-feats)相关参数的配置
  • --paste-length-tolerance <tolerance> fefault=2
  • --nj:并行任务数量(开启的线程数)
  • --cmd:运行方式
  • --write-utt2num-frames: default=true,每个音频utterance对应的帧数
  • --write-utt2dur:default=true,每个音频utterance对应的时长duration
for x in train dev test; do
  steps/make_mfcc_pitch.sh --write_utt2dur false --write_utt2num_frames false --cmd "$tr

以上是关于[语音识别] kaldi -- aidatatang_200zh脚本解析:提取特征的主要内容,如果未能解决你的问题,请参考以下文章

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

[转]Kaldi语音识别

我们基于kaldi开发的嵌入式语音识别系统升级成深度学习啦

Kaldi语音识别工具编译问题记录(踩坑记录)