[语音识别] kaldi -- aidatatang_200zh脚本解析: 数据集介绍

Posted MachineLP

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[语音识别] kaldi -- aidatatang_200zh脚本解析: 数据集介绍相关的知识,希望对你有一定的参考价值。

格式16kHz 16bit,wav,单声道
录音环境安静的室内,噪音不影响语音识别
录音内容30万条口语化句子
录音内容30万条口语化句子
录音人6,408 人 男性 2,999 人,女性 3,301 人
录音人≤20 岁 1,481 人,21~30 岁 4,412 人,31~40 岁 244 人,40 岁以上 163 人
录音人录音人员分布于广东、福建、山东、江苏、北京、湖南、江西、香港、澳门等 34个省级行政区域
设备安卓:ios=9:1
语音普通话;有口音的普通话
应用场景语音识别,机器翻译,声纹识别
准确率句标注准确率不低于98%
数据集大小18G(18756983399byte)

以上是关于[语音识别] kaldi -- aidatatang_200zh脚本解析: 数据集介绍的主要内容,如果未能解决你的问题,请参考以下文章

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

语音识别工具kaldi下载与安装

[转]Kaldi语音识别

我们基于kaldi开发的嵌入式语音识别系统升级成深度学习啦

Kaldi语音识别工具编译问题记录(踩坑记录)