python做语音信号处理

Posted 凌逆战

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python做语音信号处理相关的知识,希望对你有一定的参考价值。

声音的输入输出

标准的python已经支持WAV格式的书写,而实时的声音输入输出需要安装pyAudiio(http://people.csail.mit.edu/hubert/pyaudio)。最后我们还将使用pyMedia(http://pymedia.org)进行Mp3的解码和播放。

掌握了上面的基础知识之后,就可以做许多有趣的声效处理的算法实验了。声效处理方面的内容将在以后的章节详细介绍。

读写Wave文件

WAV是Microsoft开发的一种声音文件格式,虽然它支持多种压缩格式,不过它通常被用来保存未压缩的声音数据(PCM脉冲编码调制)。

WAV有三个重要的参数:声道数、取样频率和量化位数。

  • 声道数:可以是单声道或者是双声道
  • 采样频率:一秒内对声音信号的采集次数,常用的有8kHz, 16kHz, 32kHz, 48kHz, 11.025kHz, 22.05kHz, 44.1kHz
  • 量化位数:用多少bit表达一次采样所采集的数据,通常有8bit、16bit、24bit和32bit等几种

例如CD中所储存的声音信号是双声道、44.1kHz、16bit。

如果你需要自己录制和编辑声音文件,推荐使用Audacity(http://audacity.sourceforge.net),它是一款开源的、跨平台、多声道的录音编辑软件。在我的工作中经常使用Audacity进行声音信号的录制,然后再输出成WAV文件供Python程序处理。

读Wave文件

 

 

 

 

 

 

参考文献:

网址:用python做科学计算 http://old.sebug.net/paper/books/scipydoc/index.html#

 

以上是关于python做语音信号处理的主要内容,如果未能解决你的问题,请参考以下文章

Python之librosa库语音信号处理

AI实现语音文字处理,PaddleSpeech项目安装使用 | 机器学习

使用 Python 减去/比较两个音频文件之间的差异

语音识别入门Python音频处理示例(含完整代码)

python语音签名识别?

如何用matlab混合语音信号