语音识别简述

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了语音识别简述相关的知识,希望对你有一定的参考价值。

参考技术A 一、概念

语音识别是指将声音内容转换成文字的技术。

它是一门交叉的、非常复杂的学科,需要具备生理学、声学、信号处理、计算机科学、模式识别、语言学、心理学等相关学科的知识。

二、发展

随着科技的发展,语音识别技术在理论和应用方面都取得了重大突破,越来多的应用到了日常生活中。比如智能家居,车载娱乐,语音识别听写器、语音寻呼答疑平台、智能客服等。

三、简单应用原理

通常语音识别有两种工作模式,唤醒模式和识别模式。所谓唤醒模式,即应用处于待唤醒状态,此种状态引擎会一直在后台录音,用于判别是否有【唤醒词】,如果识别到唤醒词,即转为识别模式。所谓识别模式,是指我们说出的语音被转为文字以及带有特定格式的一段数据,即对于所识别到的语音进行结构化处理。处理后通常会以json的形式提供给外部应用进行再次解析处理,用于满足应用自身功能。

比如一些支持语音功能的智能家居,首先把应用唤醒(比如,小爱同学),然后说指令(比如,开空调)。语音识别引擎识别出语义,把结果(json数据)给到APP,APP把结构化的语义进行分类处理。再比如,如果想查询天气,语音说“明天天气如何”。识别引擎会根据位置信息,联网检索相关天气信息提供给APP。

注:

唤醒词:用于唤醒应用的特定语音,例如“hi,siri”,通常用户可以自定义

以上是关于语音识别简述的主要内容,如果未能解决你的问题,请参考以下文章

人工智能最新研究发展方向——OCR文字识别简述

人工智能最新研究发展方向——OCR文字识别简述

语音识别玩转语音识别 1 语音识别简介

语音识别技术的环节是啥

什么是自动语音识别功能?

Unity语音识别(百度AI长语句语音识别&Unity原生短语语音识别)