音频波形到整数序列
Posted
技术标签:
【中文标题】音频波形到整数序列【英文标题】:audio waveform to Integer sequence 【发布时间】:2014-07-01 17:03:51 【问题描述】:我需要从音频文件创建一个整数序列。我正在检查波形库,因为它绘制了一个线性图。但我正在寻找关键信息,用于绘制图形的整数的来源是什么?是幅度吗?频率 ?或者是其他东西 ?有可用的库,但我需要知道我需要提取什么信息单元才能获得可以提供给图表的数据。然而,绘制图表不是我的目标。我只想要那个原始整数数组。
【问题讨论】:
取决于您正在谈论的音频文件的类型。.wav
非常简单(固定间隔的幅度)。压缩格式更复杂,但大多数使用某种变换(DCT、FFT 等)将单个样本转换为基于频率的编码。
任何类型都可以,我只需要知道过程。我对 wav 没意见
在这种情况下,您需要处理Wave File Format。
【参考方案1】:
当然,获得波形波形图需要的是振幅,例如,PCM 数据存储在 wav 文件中的方式(数据直接位于文件头之后)。请注意,有 8 位和 16 位格式,后者也可能是 big-endian 或 little-endian,具体取决于字节顺序(只是为了让您注意这一点)。
【讨论】:
那么频率在音乐中的作用是什么?你能详细说明吗? 粗略地说,快速变化的“局部幅度”会产生包含各种频率的信号,可以表示为傅里叶级数。至于音乐,440赫兹是音叉的标准频率。在计算中,波形只是一组离散样本。【参考方案2】:音频只是一条曲线 - 当您在 X 轴上随时间绘制它时,Y 轴是幅度 - 类似于绘制正弦数学函数 - 曲线上的每个点都是存储在音频文件中的数字 - WAV格式化这个数字通常是一个 16 位无符号整数 - 所以忽略 44 字节标题 - 文件的其余部分只是这些整数的序列。当该曲线随时间快速上下变化时,频率高于曲线随时间变化较慢的情况。如果您下载音频工作台应用程序:Audacity,您可以查看任何音频文件(WAV、mp3、...)的此曲线
【讨论】:
频率在音乐中的作用是什么?如果都是振幅 如果你在一张纸上画一个 sin 曲线的周期 - 从左到右用完整张纸在它的 360 度上 - 让我们认为它相对于你绘制时的频率较低10个这样的循环在论文中 - 幅度是曲线的高度,频率只是每单位时间高低幅度点数量的计数 - 每秒的循环数 - 查找赫兹 能够看到音频曲线可能会有所帮助 - 安装应用程序:Audacity 并打开各种 WAV、mp3 音频文件 - 它让您在显示音频曲线的同时听到声音 简短的回答是 - 您可以控制的唯一变量是幅度,改变幅度的速度决定了频率 - 详情请参阅:billposer.org/Linguistics/Computation/LectureNotes/…以上是关于音频波形到整数序列的主要内容,如果未能解决你的问题,请参考以下文章
关于数字采样溢出点(采样周期非码波形周期的整数倍时)的一点思考
关于数字采样溢出点(采样周期非码波形周期的整数倍时)的一点思考