PCM和WAV音频格式的区别,以及python自动转换
Posted 一个不正常的人
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PCM和WAV音频格式的区别,以及python自动转换相关的知识,希望对你有一定的参考价值。
目录
WAV和PCM的简单介绍
PCM
pcm:pulse code modulation,脉冲编码调制。将声音等模拟信号变成符号化的脉冲列,予以记录。是由[0]、[1]等符号构成的数字信号,未经过任何编码和压缩处理。pcm是没有压缩的编码方式。
WAV
wav:wav是一种无损音频文件格式,wav都有一个文件头,文件头包括音频流的【编码参数】,而对音频流的编码没有硬性规定,符合ACM规范的编码都行,所以wav格式通常只要在其他编码(pcm、MP3)下,加相应的decode(头文件)就可以转换
图片引用来源:
WAV和PCM的关系和区别
关于音频的基础知识
声道数channels
声道数即声音通道的数目。比如单声道就是左右声道播放是同一个声音,立体声可以使左右声道分工,使听起来有空间效果。
采样位数bits
也可以称为采样值或取样值,或叫采样精度、位深度,就是将采样样本幅度量化。例如8bits就是把纵坐标分成2的8次方,即256份。可以衡量声音波动变化的一个参数(声卡的分辨率)
采样频率sample_rate
取样频率,每秒取得声音样本的次数。频率越高,声音的质量也就越好,还原也就越真实。
由于人耳的分辨率很有限,太高的频率并不能分辨出来。在16位声卡中有22KHz、44KHz等几级,其中,22KHz相当于普通FM广播的音质,44KHz已相当于CD音质了,目前的常用采样频率都不超过48KHz
图片引用来源:PCM和WAV数据结构
pcm文件所占容量:储存量=(采样频率*采样位数*声道*时间)/ 8 | (8为单位,字节数)
进阶内容
互相转换代码
import wave
import numpy as np
# pcm转wav格式,单声道,采样精度,采样率
def pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000):
with open(pcm_file,'rb') as f:
pcmdata = f.read()
if bits % 8 != 0:
raise ValueError("bits % 8 must == 0. now bits:"+str(bits))
wavfile = wave.open(wav_file,'wb')
wavfile.setnchannels(channels)
wavfile.setsampwidth(bits // 8)
wavfile.setframerate(sample_rate)
wavfile.writeframes(pcmdata)
wavfile.close()
# wav转pcm格式
def wav2pcm(wav_file, pcm_file, data_type=np.int16):
with open(wav_file,'rb') as f:
f.seek(0)
f.read(44)
data = np.fromfile(f,dtype=data_type)
data.tofile(pcm_file)
#wav_file,pcm_file分别是两种格式文件的读取(存储)路径
————————————————————————
新学内容,外行,可能有误
Python 调用pyaudio库录制以及播放wav音频文件
1.Pyaudio简介
PyAudio 是语音处理的 Python 库,提供了比较丰富的功能。
python的Pyaud模块可以调用电脑的麦克风或音响进行录音,音频播放,生成wav
文件等。
wave是录音是用的标准的WINDOWS文件格式,扩展名为WAV,数据本身的格式为PCM或压缩型,属于无损音乐格式的一种。
3.Pyaudio安装
pip install pyaudio
推荐使用清华源哦,速度快
pip install pyaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
4.使用Pyaudio进行录音
导入所需库
import wave import pyaudio def audio_record(out_file, rec_time): CHUNK = 1024 FORMAT = pyaudio.paInt16 # 16bit编码格式 CHANNELS = 1 # 单声道 RATE = 16000 # 16000采样频率 ? p = pyaudio.PyAudio() # 创建音频流 stream = p.open(format=FORMAT, # 音频流wav格式 channels=CHANNELS, # 单声道 rate=RATE, # 采样率16000 input=True, frames_per_buffer=CHUNK) ? print("开始录制。。。") ? frames = [] # 录制的音频流 # 录制音频数据 for i in range(0, int(RATE / CHUNK * rec_time)): data = stream.read(CHUNK) frames.append(data) ? # 录制完成 stream.stop_stream() stream.close() p.terminate() ? print("完成。。。。。")
将它封装成函数,直接去调用,函数的参数分别为文件名称和录制时间。
5.使用Pyaudio库播放录音
import wave import pyaudio ? def play(): chunk = 1024 # 2014kb wf = wave.open(r"文件名", ‘rb‘) p = pyaudio.PyAudio() stream = p.open(format=p.get_format_from_width(wf.getsampwidth()), channels=wf.getnchannels(), rate=wf.getframerate(), output=True) ? data = wf.readframes(chunk) # 读取数据 print(data) while data != b‘‘: # 播放 stream.write(data) data = wf.readframes(chunk) print(‘while循环中!‘) print(data) stream.stop_stream() # 停止数据流 stream.close() p.terminate() # 关闭 PyAudio play()
跟多内容参考官方文档`http://people.csail.mit.edu/hubert/pyaudio/docs/`
以上是关于PCM和WAV音频格式的区别,以及python自动转换的主要内容,如果未能解决你的问题,请参考以下文章
Python 调用pyaudio库录制以及播放wav音频文件
wav音频文件解析读取 定点转浮点分析 幅值提取(C语言实现)
Microsoft 认知服务 SST 支持哪些音频格式?为啥 16 位 PCM x.wav 成功而 32 位 PCM y.wav 不成功?