语音识别

Posted 轩辕吊雷

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了语音识别相关的知识,希望对你有一定的参考价值。

语音识别,可以分为在线识别,离线命令词,及唤醒词

在线识别: 即联网使用的识别功能,支持自定义词库及自训练平台。目前在线识别支持普通话、英文、粤语和四川话,通过在请求时配置不同的pid参数,选择对应模型。默认为麦克风输入,可以设置参数为pcm格式16k采样率,16bit,小端序,单声道的音频流输入。
离线命令词: 断网时识别固定的预定义短语(定义在bsg文件中),SDK强制优先使用在线识别。 断网时激活,只能识别预定义的短语。联网时,强制使用在线识别。固定短语的语法需要从控制台“离线词&本地语义”模块预定义并下载为baidu_speech_grammar.bsg文件
唤醒词:识别预定义的“关键词”, 这个“关键词”必须在一句话的开头。 本地功能,不需要网络。唤醒词即识别“关键词”,当SDK的识别引擎“听到”录音中的关键词后,立即告知用户。与android系统的锁屏唤醒完全无关。关键词和离线命令词一样,需要预定义并下载为WakeUp.bin文件

以上是关于语音识别的主要内容,如果未能解决你的问题,请参考以下文章

语音识别技术的环节是啥

什么是自动语音识别功能?

Unity语音识别(百度AI长语句语音识别&Unity原生短语语音识别)

语音识别传统语音识别带权有限转态转换器深度语音识别时序分类CTC解码

百度语音识别vs科大讯飞语音识别

树莓派怎么调用科大讯飞的语音库实现语音识别