PCM和WAV音频格式的区别，以及python自动转换

Posted 2023-04-04 一个不正常的人

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了PCM和WAV音频格式的区别，以及python自动转换相关的知识，希望对你有一定的参考价值。

WAV和PCM的简单介绍

PCM

pcm：pulse code modulation，脉冲编码调制。将声音等模拟信号变成符号化的脉冲列，予以记录。是由[0]、[1]等符号构成的数字信号，未经过任何编码和压缩处理。pcm是没有压缩的编码方式。

WAV

wav：wav是一种无损音频文件格式，wav都有一个文件头，文件头包括音频流的【编码参数】，而对音频流的编码没有硬性规定，符合ACM规范的编码都行，所以wav格式通常只要在其他编码（pcm、MP3）下，加相应的decode（头文件）就可以转换

图片引用来源：
WAV和PCM的关系和区别

关于音频的基础知识

声道数channels

声道数即声音通道的数目。比如单声道就是左右声道播放是同一个声音，立体声可以使左右声道分工，使听起来有空间效果。

采样位数bits

也可以称为采样值或取样值，或叫采样精度、位深度，就是将采样样本幅度量化。例如8bits就是把纵坐标分成2的8次方，即256份。可以衡量声音波动变化的一个参数（声卡的分辨率）

采样频率sample_rate

取样频率，每秒取得声音样本的次数。频率越高，声音的质量也就越好，还原也就越真实。

由于人耳的分辨率很有限，太高的频率并不能分辨出来。在16位声卡中有22KHz、44KHz等几级，其中，22KHz相当于普通FM广播的音质，44KHz已相当于CD音质了，目前的常用采样频率都不超过48KHz

图片引用来源：PCM和WAV数据结构

pcm文件所占容量：储存量=（采样频率*采样位数*声道*时间）/ 8 | （8为单位，字节数）

进阶内容

PCM和WAV数据结构

互相转换代码

import wave
import numpy as np

# pcm转wav格式，单声道，采样精度，采样率
def pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000):
    with open(pcm_file,'rb') as f:
        pcmdata = f.read()

    if bits % 8 != 0:
        raise ValueError("bits % 8 must == 0. now bits:"+str(bits))

    wavfile = wave.open(wav_file,'wb')
    wavfile.setnchannels(channels)
    wavfile.setsampwidth(bits // 8)
    wavfile.setframerate(sample_rate)
    wavfile.writeframes(pcmdata)
    wavfile.close()
    
# wav转pcm格式
def wav2pcm(wav_file, pcm_file, data_type=np.int16):
    with open(wav_file,'rb') as f:
        f.seek(0)
        f.read(44)
        data = np.fromfile(f,dtype=data_type)
        data.tofile(pcm_file)

#wav_file,pcm_file分别是两种格式文件的读取(存储)路径

————————————————————————
新学内容，外行，可能有误

Python 调用pyaudio库录制以及播放wav音频文件

1.Pyaudio简介

　　PyAudio 是语音处理的 Python 库，提供了比较丰富的功能。

2.功能

　　python的Pyaud模块可以调用电脑的麦克风或音响进行录音，音频播放，生成wav文件等。

wave是录音是用的标准的WINDOWS文件格式，扩展名为WAV，数据本身的格式为PCM或压缩型，属于无损音乐格式的一种。

3.Pyaudio安装

pip install pyaudio

推荐使用清华源哦，速度快

pip install pyaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

4.使用Pyaudio进行录音

　　导入所需库

import wave
import pyaudio
 

def audio_record(out_file, rec_time):
    CHUNK = 1024
    FORMAT = pyaudio.paInt16  # 16bit编码格式
    CHANNELS = 1  # 单声道
    RATE = 16000  # 16000采样频率
?
    p = pyaudio.PyAudio()
    # 创建音频流
    stream = p.open(format=FORMAT,  # 音频流wav格式
                    channels=CHANNELS,  # 单声道
                    rate=RATE,  # 采样率16000
                    input=True,
                    frames_per_buffer=CHUNK)
?
    print("开始录制。。。")
?
    frames = []  # 录制的音频流
    # 录制音频数据
    for i in range(0, int(RATE / CHUNK * rec_time)):
        data = stream.read(CHUNK)
        frames.append(data)
?
    # 录制完成
    stream.stop_stream()
    stream.close()
    p.terminate()
?
    print("完成。。。。。")

将它封装成函数，直接去调用，函数的参数分别为文件名称和录制时间。

5.使用Pyaudio库播放录音

import wave
import pyaudio
?
def play():
    chunk = 1024  # 2014kb
    wf = wave.open(r"文件名", ‘rb‘)
    p = pyaudio.PyAudio()
    stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), channels=wf.getnchannels(),
                    rate=wf.getframerate(), output=True)
?
    data = wf.readframes(chunk)  # 读取数据
    print(data)
    while data != b‘‘:  # 播放
        stream.write(data)
        data = wf.readframes(chunk)
        print(‘while循环中！‘)
        print(data)
    stream.stop_stream()  # 停止数据流
    stream.close()
    p.terminate()  # 关闭 PyAudio
play()

跟多内容参考官方文档`http://people.csail.mit.edu/hubert/pyaudio/docs/`

以上是关于PCM和WAV音频格式的区别，以及python自动转换的主要内容，如果未能解决你的问题，请参考以下文章