语音识别简述

Posted 2023-03-16

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了语音识别简述相关的知识，希望对你有一定的参考价值。

参考技术A 一、概念

语音识别是指将声音内容转换成文字的技术。

它是一门交叉的、非常复杂的学科，需要具备生理学、声学、信号处理、计算机科学、模式识别、语言学、心理学等相关学科的知识。

二、发展

随着科技的发展，语音识别技术在理论和应用方面都取得了重大突破，越来多的应用到了日常生活中。比如智能家居，车载娱乐，语音识别听写器、语音寻呼答疑平台、智能客服等。

三、简单应用原理

通常语音识别有两种工作模式，唤醒模式和识别模式。所谓唤醒模式，即应用处于待唤醒状态，此种状态引擎会一直在后台录音，用于判别是否有【唤醒词】，如果识别到唤醒词，即转为识别模式。所谓识别模式，是指我们说出的语音被转为文字以及带有特定格式的一段数据，即对于所识别到的语音进行结构化处理。处理后通常会以json的形式提供给外部应用进行再次解析处理，用于满足应用自身功能。

比如一些支持语音功能的智能家居，首先把应用唤醒（比如，小爱同学），然后说指令（比如，开空调）。语音识别引擎识别出语义，把结果（json数据）给到APP，APP把结构化的语义进行分类处理。再比如，如果想查询天气，语音说“明天天气如何”。识别引擎会根据位置信息，联网检索相关天气信息提供给APP。

注：

唤醒词：用于唤醒应用的特定语音，例如“hi，siri”，通常用户可以自定义

以上是关于语音识别简述的主要内容，如果未能解决你的问题，请参考以下文章

人工智能最新研究发展方向——OCR文字识别简述

语音识别玩转语音识别 1 语音识别简介

语音识别技术的环节是啥

什么是自动语音识别功能？

Unity语音识别(百度AI长语句语音识别&Unity原生短语语音识别)