签名的 16 位 PCM 转换不起作用。为啥？

Posted 2023-04-13

技术标签:

【中文标题】签名的 16 位 PCM 转换不起作用。为啥？【英文标题】：Signed 16 bit PCM transformations aren't working. Why?签名的 16 位 PCM 转换不起作用。为什么？ 【发布时间】：2013-09-11 14:49:53 【问题描述】：

在过去的 2 天里，我一直在尝试在 android 上操作 16 位 PCM 数据，但收效甚微。我目前正在使用WAV recorder 来捕获音频。在使用randomAccessWriter 写入缓冲区之前的onPeriodicNotification(AudioRecord recorder) 方法中，我将缓冲区发送到自定义类，以操作样本，并将样本保存回缓冲区。我的自定义类中的方法如下：

由于缓冲区是一个字节数组，我首先将它们转换为短片，现在一个短片代表一帧（只有一个通道）。一旦我克服了这个障碍，我将实现 FFT 算法，这需要输入是一个浮点数组 - 所以我将每个短路转换为浮点数。现在，将数据写入 WAV 文件的randomAccessWriter 接受一个字节数组，并期望每帧为 2 个字节。因此，我将每个浮点数转换回一个短整数，并使用 ByteBuffer 重建一个字节数组，然后返回该数组。当我运行我的记录器应用程序时，通过上述代码发送缓冲区，一切都很好。

我尝试使用简单的语音调制算法来测试录音是否被修改，算法放在TODO注释所在的位置：

现在，如果我在我的 iPhone 上使用上述代码，音频样本将被转换，尽管数据本身是 32 位浮点数。但是，在 Android 上，当我重新运行记录器应用程序并插入上述代码时，所产生的只是白噪声。在我可以使用上述代码成功修改示例之前，我无法继续使用我的 FFT 算法。

为什么会这样？如果有关于该主题的知识的人可以阐明该主题，我将不胜感激。

已解决 - Bjorn Roche

根本原因：录制是在小端中提供数据，而 Java 短片是在大端中；当使用两种不同形式应用函数时，会产生白噪声。下面的代码展示了如何接收一个 Little Endian 字节数组，转换为 Big Endian 浮点数组并返回到 Little Endian 字节数组。虽然浮动你可以随心所欲，但我现在将使用我的 FFT 算法：

public byte[] manipulateSamples(byte[] data,
                                int samplingRate,
                                int numFrames,
                                short numChannels) 

    // Convert byte[] to short[] (16 bit) to float[] (32 bit) (End result: Big Endian)
    ShortBuffer sbuf = ByteBuffer.wrap(data).asShortBuffer();
    short[] audioshorts = new short[sbuf.capacity()];
    sbuf.get(audioShorts);

    float[] audioFloats = new float[audioShorts.length];

    for (int i = 0; i < audioShorts.length; i++) 
        audioFloats[i] = ((float)Short.reverseBytes(audioShorts[i])/0x8000);
    

    // Do your tasks here.

    // Convert float[] to short[] to byte[] (End result: Little Endian)
    audioShorts = new short[audioFloats.length];
    for (int i = 0; i < audioFloats.length; i++) 
        audioShorts[i] = Short.reverseBytes((short) ((audioFloats[i])*0x8000));
    

    byte byteArray[] = new byte[audioShorts.length * 2];
    ByteBuffer buffer = ByteBuffer.wrap(byteArray);
    sbuf = buffer.asShortBuffer();
    sbuf.put(audioShorts);
    data = buffer.array();

    return data;

【问题讨论】：

首先，我会检查传递场景，中间没有任何处理。你应该把你放进去的东西拿出来。我可以建议你写一些单元测试吗？您也可以尝试使用调试器逐步完成此操作。我会特别注意将浮点数除以整数 ((float)audioShorts[i])/0x8000)。不记得 Java 的促销规则，但这看起来是一个合理的原因。尝试将其重铸为(float)audioShorts[i])/32768.0f。你可能在另一个方向上也有同样的问题。感谢您的输入，我试过中间不做任何处理，数据通过正常，我也试过你的建议，噪音仍然存在，我很困惑为什么会这样因为我不知道为什么会发生，所以我无法编写任何 junit 测试。在尝试如此复杂的测试之前，您应该尝试一些简单的事情，例如除以 2。我也试过了，而不是 Math.sin(theta) 我做了 *= 0.5。结果是白噪声。 【参考方案1】：

您的问题是 java 中的 short 是 bigendian，但如果您从 WAV 文件中获取数据，则数据是 little endian。

【讨论】：

无论如何我可以将它们转换为 Little Endian，将样本转换为 Big Endian（正如 RandomAccessWriter 所期望的那样），还是我必须保存 wav 文件，然后重新打开它然后对样本做我想做的事情？等等，我刚刚重读了你说的话。数据已经在 Big Endian 中，正在从 Mic 记录数据。因此，我不应该能够以我尝试的方式进行转换吗？我可能会错过它，但是查看 wav 记录器的代码，我看不到记录和写入文件之间的任何字节交换。也就是说录音的字节序和文件是一样的，而WAV文件是little-endian，所以录音是little endian。为什么不尝试交换字节，除以二，然后将字节交换回来。你会知道它是否有效。我非常感谢你，我的困惑来自使用 ByteBuffers 的 order() 函数以及使用 Byte.BIG_ENDIAN 和 Byte.LITTLE_ENDIAN 但这些都失败了。相反，我把单条短裤倒过来，它奏效了。谢谢！！！

以上是关于签名的 16 位 PCM 转换不起作用。为啥？的主要内容，如果未能解决你的问题，请参考以下文章