音效处理Compressor 压缩器算法简介

Posted 2022-11-27 芥末的无奈

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了音效处理Compressor 压缩器算法简介相关的知识，希望对你有一定的参考价值。

系列文章目录

文章目录

系列文章目录
一、Compressor
- 1.1 动态范围
二、Compressor 算法实现
总结
参考

一、Compressor

1.1 动态范围

Compressor 中文译为 “压缩器” 或者 “动态压缩器”，它是一种音频动态范围处理算法。所谓动态范围，以我粗鄙的理解它描述了：音频最大声的那个点与最小声那个点之间的差异范围。

举个例子，很多古典音乐的动态范围大，整首曲子中声音小的地方非常小，可能需要你提起耳朵仔细听，但在声音大的地方也震耳欲聋，例如命运交响曲，贝多芬月光奏鸣曲等，作者通过不同的音量来表达不同的情感，我们在听此类音乐时也能感受到作者想要表达的情绪；但在流行/Pop等流派的音乐，从头到尾就是动次打次的，突出一个 “燥”，音量也是从始至终拉满，这样的音乐动态范围就小得多。

下面两个图是命运交响曲和贾斯汀比伯-Stay 的波形图，你现在应该很容易就能区分出哪个是哪个。

动态范围是大一点好，还是小一点好呢？这个问题始终存在争论，只能说仁者见仁，智者见智了。但非常明确的一点是，人们对于音频动态范围调整是有需求的。早期的广播仪器非常脆弱，过大的音量可能会导致保险丝过热烧毁，因此需要通过技术手段压缩音频的高潮部分；另外，人耳天生对响度大的音频更感兴趣，越来越多的歌手通过动态调整的技术来提升发行歌曲的响度，只要压缩高音量部分和提升低音量部分，牺牲动态范围来提升整体响度就可以了，这也是响度战争的由来。除开提升响度，似乎也有一些听上去很正当的理由，例如动态范围过大会容易导致人耳疲惫，通过动态压缩可以让歌曲听起来更轻松等等，这么说也不无道理，歌手可能认为”我的歌 happy 就完了，怎么 happy 怎么来“，动态范围啥的根本就不用管。

二、Compressor 算法实现

关于 Compressor 的具体算法，这里参考 Digital Dynamic Range Compressor Design— A Tutorial and Analysis，整篇论文对 Compressor 的算法描述十分详细，本人在这里只挑选重要部分进行说明，详细内容请大家自行参看论文。OK，让我们开始。

动态范围压缩算法（Dynamic Range Compression，DRC）是将音频信号的动态范围映射到一个较小的范围内的过程，即降低较高的峰值的信号电平，而不处理较安静的部分。DRC被广泛用于音频录制、制作工作、降噪、广播和现场表演等应用中。

与其他音效算法相比，Compressor 可能是最为复杂的一种，它的设计涉及多个方面，包括 Compressor 的拓扑结构、静态压缩特性、平滑滤波器的类型等等。对 Compressor 的设计进行分析是非常困难的，因为它是一个带状态的非线性时变系统。它以平滑的方式进行增益控制，而非静态的瞬时完成。此外，大量的设计选择让我们几乎不可能给出一个通用的 Compressor 设计框图。”没有两个 Compressor 的声音是一样的“ 有人这样评价到。

2.1 算法参数

Compressor 中常用的参数包括如下几种。

Threshold，定义了开始压缩的音量。任何超过阈值的信号都将被压缩。例如当 Threshold = -10db，当信号音量超过 -10db 时，它将被压缩。

Ratio，控制超过 Threshold 的信号的压缩比率。例如当 Threshold = -10，input = -5，此时信号超过 Threshold 有 5db，它将被压缩，那么压缩多少呢？这就由 Ratio 控制，当 Ratio = 5 时，信号增量从原来的 5db 被抑制为 1db，当 Ratio = 2 时，则抑制为 2.5db，以此类推。

Attack Time，Attack Time 和 Release Time 在一定程度上控制 Compressor ”灵敏度“。 Attack Time 定义了一旦信号超过 Threshold，Compressor 将增益降低到期望水平所需要的时间。

Release Time 定义了一旦信号低于 Threshold，将增益恢复至正常水平需要的时间。

Attack Time 和 Release Time 是 Compressor 中最不容易理解的两个参数，我们会在后面的 ”Level Detection“ 章节对这个两个参数有更深的理解，在这里我们简单地将它们理解为灵敏度即可。Attack Time 值越小，信号超过 Threshold 就会越快地被压缩，Release Time 越小，信号恢复的也越快。

你可能会有疑问，信号超过 Threshold，我们直接进行压缩即可，为啥需要 Attack Time 和 Release Time 呢？非也非也，如果如此简单粗暴的压缩方式会引入杂音，我们为了避免杂音，首先需要得到平滑的音量曲线，而”平滑“的特性就模糊了时间的精确度，因此引入 Attack Time 和 Release Time 满足人们对时间的某种控制。

Make-up Gain，Compressor 降低信号的增益，因此可以施加一个额外的增益使得输入信号与输出信号的响度水平相当。

Knee Width，它控制了压缩曲线的特性（如下图），曲线是尖锐的拐角，还是想膝盖一样有弧度的曲线。

2.1 算法建模

进入 Compressor 的信号被分为两路，一路信号被送入侧链用于计算增益控制，另一路信号送入增益放大器中用于生成算法输出，总体结构如下图：

在数字信号设计中，如果 $x [n]$ 表示输入信号， $y [n]$ 表示输出信号， $c [n]$ 表示增益控制，那么 $c[n]\\cdot x[n]$ ，此外还要加上 Make-up Gain 以弥补增益，当我们用分贝表示信号时， Compressor 算法模型为：
$y_d B[n]=x_d B[n]+c_d B[n]+M$

$x_d B[n]$ 和 $M$ 都容易得到，而如何得到 $c_d B[n]$ 是 Compressor 算法的核心，概况来说想要得到 $c_d B[n]$ 需要两个模块：Level Detection 和 Gain Computer

2.2 Gain Computer

Gain Computer 根据输入信号的电平（音量）来计算得到需要的增益。这个阶段涉及到了 Threshold（T)、Ratio（R）、Knee Width（W) 三个参数。一旦输入信号电平超过 T，那么它会根据 R 进行衰减，计算公式如下：
$y_G=\\left\\\\beginarraycc x_G & x_G \\leq T \\\\ T+\\left(x_G-T\\right) / R & x_G>T \\endarray\\right.$
其中 $x_G$ 为输入信号电平， $y_G$ 为输出电平。

为了让 Compressor 有更加平滑的变化曲线，我们增加了 Knee Width（参考 Knee Width 参数说明图），这中模式我们称为 “Soft Knee”，其计算公式为：
$y_G=\\left\\\\beginarraycc x_G & 2\\left(x_G-T\\right)<-W \\\\ x_G+(1 / R-1)\\left(x_G-T+W / 2\\right)^2 /(2 W) & 2\\left|\\left(x_G-T\\right)\\right| \\leq W \\\\ T+\\left(x_G-T\\right) / R & 2\\left(x_G-T\\right)>W \\endarray\\right.$

2.3 Level detection

Level detection 的作用是提供信号电平的平滑表示。Attack Time 和 Release Time 将在这个阶段起作用，这两个参数对于 Compressor 算法调参也是至关重要的，如果选择了不合适的参数，很有可能导致音频出现杂音。

Attack time 和 Release time 是通过一个平滑滤波器引入的。我们可以简单模拟这个滤波器的行为：
$s[n]=\\alpha s[n-1]+(1-\\alpha) r[n]$
$\\alpha$ 是滤波器系数， $r [n]$ 是输入信号， $s [n]$ 是输出信号。我们对这个滤波器输入阶跃信号，其输出为：
$s[n]=1-\\alpha^n \\quad \\text for \\quad x[n]=1, n \\geq 1$

我们假设过了时间 $\\tau$ 后，信号上升至 $1-\\frac1e$ ，也就是说 $s[\\tau f_xs] = 1 - \\frac1e$ ，可以得到：
$\\alpha=e^-1 /\\left(\\tau f_s\\right) \\tag1$