PCM和WAV音频格式的区别,以及python自动转换

Posted 一个不正常的人

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PCM和WAV音频格式的区别,以及python自动转换相关的知识,希望对你有一定的参考价值。

目录

WAV和PCM的简单介绍

PCM

pcm:pulse code modulation,脉冲编码调制。将声音等模拟信号变成符号化的脉冲列,予以记录。是由[0]、[1]等符号构成的数字信号,未经过任何编码和压缩处理。pcm是没有压缩的编码方式。

WAV

wav:wav是一种无损音频文件格式,wav都有一个文件头,文件头包括音频流的【编码参数】,而对音频流的编码没有硬性规定,符合ACM规范的编码都行,所以wav格式通常只要在其他编码(pcm、MP3)下,加相应的decode(头文件)就可以转换

图片引用来源:
WAV和PCM的关系和区别

关于音频的基础知识

声道数channels

声道数即声音通道的数目。比如单声道就是左右声道播放是同一个声音,立体声可以使左右声道分工,使听起来有空间效果。

采样位数bits

也可以称为采样值或取样值,或叫采样精度、位深度,就是将采样样本幅度量化。例如8bits就是把纵坐标分成2的8次方,即256份。可以衡量声音波动变化的一个参数(声卡的分辨率)

采样频率sample_rate

取样频率,每秒取得声音样本的次数。频率越高,声音的质量也就越好,还原也就越真实。

由于人耳的分辨率很有限,太高的频率并不能分辨出来。在16位声卡中有22KHz、44KHz等几级,其中,22KHz相当于普通FM广播的音质,44KHz已相当于CD音质了,目前的常用采样频率都不超过48KHz

图片引用来源:PCM和WAV数据结构

pcm文件所占容量:储存量=(采样频率*采样位数*声道*时间)/ 8 | (8为单位,字节数)

进阶内容

PCM和WAV数据结构

互相转换代码

import wave
import numpy as np

# pcm转wav格式,单声道,采样精度,采样率
def pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000):
    with open(pcm_file,'rb') as f:
        pcmdata = f.read()

    if bits % 8 != 0:
        raise ValueError("bits % 8 must == 0. now bits:"+str(bits))

    wavfile = wave.open(wav_file,'wb')
    wavfile.setnchannels(channels)
    wavfile.setsampwidth(bits // 8)
    wavfile.setframerate(sample_rate)
    wavfile.writeframes(pcmdata)
    wavfile.close()
    
# wav转pcm格式
def wav2pcm(wav_file, pcm_file, data_type=np.int16):
    with open(wav_file,'rb') as f:
        f.seek(0)
        f.read(44)
        data = np.fromfile(f,dtype=data_type)
        data.tofile(pcm_file)

#wav_file,pcm_file分别是两种格式文件的读取(存储)路径

————————————————————————
新学内容,外行,可能有误

Python 调用pyaudio库录制以及播放wav音频文件

1.Pyaudio简介

  PyAudio 是语音处理的 Python 库,提供了比较丰富的功能。

2.功能

  python的Pyaud模块可以调用电脑的麦克风或音响进行录音,音频播放,生成wav文件等。

wave是录音是用的标准的WINDOWS文件格式,扩展名为WAV,数据本身的格式为PCM或压缩型,属于无损音乐格式的一种。

3.Pyaudio安装

pip install pyaudio

推荐使用清华源哦,速度快

pip install pyaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

4.使用Pyaudio进行录音

  导入所需库

import wave
import pyaudio
 

def audio_record(out_file, rec_time):
    CHUNK = 1024
    FORMAT = pyaudio.paInt16  # 16bit编码格式
    CHANNELS = 1  # 单声道
    RATE = 16000  # 16000采样频率
?
    p = pyaudio.PyAudio()
    # 创建音频流
    stream = p.open(format=FORMAT,  # 音频流wav格式
                    channels=CHANNELS,  # 单声道
                    rate=RATE,  # 采样率16000
                    input=True,
                    frames_per_buffer=CHUNK)
?
    print("开始录制。。。")
?
    frames = []  # 录制的音频流
    # 录制音频数据
    for i in range(0, int(RATE / CHUNK * rec_time)):
        data = stream.read(CHUNK)
        frames.append(data)
?
    # 录制完成
    stream.stop_stream()
    stream.close()
    p.terminate()
?
    print("完成。。。。。")

 

将它封装成函数,直接去调用,函数的参数分别为文件名称和录制时间。

5.使用Pyaudio库播放录音

import wave
import pyaudio
?
def play():
    chunk = 1024  # 2014kb
    wf = wave.open(r"文件名", rb)
    p = pyaudio.PyAudio()
    stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), channels=wf.getnchannels(),
                    rate=wf.getframerate(), output=True)
?
    data = wf.readframes(chunk)  # 读取数据
    print(data)
    while data != b‘‘:  # 播放
        stream.write(data)
        data = wf.readframes(chunk)
        print(while循环中!)
        print(data)
    stream.stop_stream()  # 停止数据流
    stream.close()
    p.terminate()  # 关闭 PyAudio
play()

 

跟多内容参考官方文档`http://people.csail.mit.edu/hubert/pyaudio/docs/`

 

以上是关于PCM和WAV音频格式的区别,以及python自动转换的主要内容,如果未能解决你的问题,请参考以下文章

Python 调用pyaudio库录制以及播放wav音频文件

wav格式和pcm格式怎么相互转换?

音频数据文件格式(PCM,WAV,MIDI)简记

wav音频文件解析读取 定点转浮点分析 幅值提取(C语言实现)

Microsoft 认知服务 SST 支持哪些音频格式?为啥 16 位 PCM x.wav 成功而 32 位 PCM y.wav 不成功?

在 Python 中检测并录制音频为 PCM 格式