Kaldi如何统计data数据集
Posted jarvanwang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kaldi如何统计data数据集相关的知识,希望对你有一定的参考价值。
- 统计时长
wav-to-duration scp:data/train/wav.scp ark,t:- 2>/dev/null|awk ‘BEGIN{SUM=0}{SUM+=$2}END{print SUM/3600}‘
或
awk ‘BEGIN{SUM=0}{SUM+=$2}END{print SUM/3600}‘ data/train/utt2dur
- 生成utt2dur
utils/data/get_utt2dur.sh data/train
- 统计句子数
wc -l data/train/text
以上是关于Kaldi如何统计data数据集的主要内容,如果未能解决你的问题,请参考以下文章