《语音信号处理》《第2章 语音信号的声学基础及产生模型》

Posted focus-z

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《语音信号处理》《第2章 语音信号的声学基础及产生模型》相关的知识,希望对你有一定的参考价值。

语音学三个分支:

1. 发音语音学

2. 声学语音学----进一步出现了声音模拟、语音合成、语音识别

3. 听觉语音学和心理语言学----研究人耳和大脑

本章介绍语音产生的过程及人耳的听觉过程,传统的线性语音产生模型以及目前广泛受到重视的非线性

语音产生模型,这些都是从事语音信号处理研究的基础知识。

2.1 语音信号的产生

声带振动产生声音,这是产生声音的基本声源,称为声带音源。

基音周期

基音频率 80Hz - 500Hz

声道

浊音 voiced sound 声带振动产生的

清音 unvoiced sound

语音是以声波的方式在空气中传播。声波是一种纵波,它的振动方向和传播方向是一致的

复合音

纯音--仅仅有基音,没有倍音。

法国物理学家傅里叶发现了各个声音之间的区别在于和弦(chord)的不同。

之所以能够听出每种乐器都有自己特殊的音色,就是因为它们的和弦不同。

一个声音的基音与倍音,共同组成这个声音的和弦。

在复合音中,基频的频率最低,但振幅最大。其余各个倍音的能量逐渐地减少,振幅就逐渐减小。

2.1.3 语音信号在时域和频域的表示

频谱是是表征语音特性的基本参数。其中共振峰就是一个典型的频域参数,它可以决定信号频谱的

总体轮廓或谱包络。

一般假设语音信号是一种短时平稳信号时频分析,小波变换

语谱图----时频图

2.1.5 汉语语音的韵律特性

语音的声学特征是指音色、音高、音长和音强。

汉语中,主要靠音色和音高来区别语义,而音强和音长不能区别语义。

以上是关于《语音信号处理》《第2章 语音信号的声学基础及产生模型》的主要内容,如果未能解决你的问题,请参考以下文章

如何将声学的spectrogram(声谱图)重新反变换成时域语音信号

语音云识别的原理

语音信号处理1---基本概念

AI 全栈 SOTA 综述 这些你都不知道,怎么敢说会 AI?语音识别原理 + 实战

音频基础 2

基于DNN-HMM的语音识别技术