处理带有小数的字节数组后的 Java Sound API 噪声

Posted 2023-04-13

技术标签:

【中文标题】处理带有小数的字节数组后的 Java Sound API 噪声【英文标题】：Java Sound API noise after processing the byte array with a fraction number 【发布时间】：2010-11-25 06:37:24 【问题描述】：

我正在尝试处理从采样的 sourcedataline (Java Sound API) 获得的字节数组。如果我将字节数组与分数相乘，播放流时会出现噪音。

在播放声音之前，我将立体声 wav 文件分成左右声道。这工作正常。但是，如果我想使用取决于延迟因子的增益控制来处理通道，我会得到噪音。

for(int i=0; i<bufferSize; i++)  array[i] = (byte) (array[i] * gain);

有人知道如何解决这个问题吗？

//编辑：

我试图通过位移将这两个字节转换为一个短字节（2字节），例如：

short leftMask = 0xff00;
short rightMask = 0x00ff;
short sValue = (array[i] + array[i+1] <<8) * gain;

array[i] = (sValue & leftMask) >> 8;
array[i+1] = (sValue & rightMask);

但是当我将单个字节乘以增益值时，我得到了相同的结果。

//编辑

或者我应该像这样将两个数组值添加到一个short中吗？

short shortValue = array[i] + array[i+1];
shortValue *= gain;
array[i] = ???

但是如何在不丢失声音的情况下将此短字节转换为 2 个单字节？

//编辑分离方法中的一些代码：

public static void channelManipulation(byte[] arrayComplete) 
        int i=2; 
        char channel='L';
        int j=0; 

        /** 
         * The stereo stream will be divided into his channels - the Left and the Right channel. 
         * Every 2 bytes the channel switches. 
         * While data is collected for the left channel the right channel will be set by 0. Vice versa.
         */
        while(j<arrayComplete.length) 
            //while we are in the left channel we are collecting 2 bytes into the arrayLeft


            while(channel=='L') 
                if(i==0) 
                    channel='R'; //switching to the right channel
                    i=2;
                    break;
                
                arrayLeft[j] = (byte)(arrayComplete[j]);
                arrayRight[j] = 0;
                i--; j++;
            

            //while we are in the right channel we are collecting 2 bytes into the arrayRight
            while(channel=='R') 
                if(i==0) 
                    channel='L'; //switching to the left channel
                    i=2;
                    break;
                
                arrayRight[j] = (byte) (arrayComplete[j]);
                arrayLeft[j] = 0;
                i--; j++;

【问题讨论】：

到底谁对这个问题投了反对票？ 【参考方案1】：

即使您的音频数据是字节数组的形式，您的 real 音频也是（我假设）一个短（2 字节）整数数组。当您将数组的每个单独字节乘以增益因子时，您会将 2 字节样本值变成乱码（又名噪声）。我不是 java 程序员，但您的解决方案是将字节数组转换为 2 字节整数数组（但是您在 java 中这样做），然后将每个 2 字节整数值乘以增益因子（然后，我想，在播放之前将其转换回字节数组。

更新：在 C# 中，如果我有一个音频数据的字节数组（例如，从实际格式为 2 字节整数的 WAV 文件中提取），我将应用增益使用像这样的 BitConverter 和 Array 类：

float gain = 0.5f;
for (int i = 0; i < audio.Length; i += 2)

    short val = BitConverter.ToInt16(audio, i);
    val = (short)((float)val * gain);
    Array.Copy(BitConverter.GetBytes(val), 0, audio, i, 2);

这很笨拙，而且我永远不会真正做。在 C# 世界中，我总是将音频作为 16 位或 32 位整数的数组，或者作为 32 位或 64 位浮点值。我真的不知道java音频是如何工作的，但是应该可以（并且更容易）在某个地方首先将您的音频作为一个16位整数数组 - 然后您就不必做任何事情了像这样的奇怪转换来应用增益或做任何你想做的事情。

更新 2：另外，我不确定您的原始音频源实际上是否包含 2 字节整数样本值。它实际上可能是 4 字节整数或（更有可能）4 字节浮点样本值，在这种情况下，我的样本代码仍会产生噪音。使用 4 字节浮点数，正确的代码是：

float gain = 0.5f;
for (int i = 0; i < audio.Length; i += 4)

    float val = BitConverter.ToSingle(audio, i);
    val *= gain;
    Array.Copy(BitConverter.GetBytes(val), 0, audio, i, 4);

【讨论】：

你有一些你喜欢的语言的代码 sn-p 吗？因为我尝试了位移位，但结果与 for 循环相同。 @MusiGenesis：是的，这正是我一直在想的。 @sn3ek：您的位移代码可能工作正常，但如果真正的音频格式是 4 字节浮点而不是 2 字节整数，它仍然会产生噪音。你是对的 - 它是一个 4Byte 流。因为在分离通道后，我得到了 LL00 和 00RR 作为 4 个字节。但我不知道如何解决我的问题。我在这个问题上工作了 1 周，但不知道如何解决。 @sn3ek：您能澄清一下“在将通道分离后，我得到 LL00 和 00RR 为 4 字节”的意思吗？如果您的格式是立体声中的 16 字节整数样本，那么每个 4 字节块将代表两个样本值（一个用于左声道，一个用于右声道）。【参考方案2】：

不起作用。我有这个代码sn-p：

for(int c=0; c<Constants.getBufferlength()-4; c+=4) 
            arrayLeft[c] = (byte) Math.min(Math.max((arrayLeft[c]*leftGain), -128), 127);

            arrayRight[c] = (byte) Math.min(Math.max((arrayRight[c]*rightGain),-128),127);

我听到了像以前一样的噪音。

【讨论】：

请不要在答案中回复。改为编辑您的问题。但是，为什么你忽略了 3/4 的价值观？哦，这就是我编辑代码的原因。代码是： for(int c=0; c【参考方案3】：

您需要应用一些剪辑。假设您有一个值为 100 的样本，并且您正在应用 2 的增益。乘法的结果将是 200，然后最终截断为 -73。

试试：

array[i] = Math.min(Math.max(array[i] * gain, -128), 127);

作为对此的测试 - 如果您应用的增益实际上是“静默”增益（例如 0.5），那么此时您不应该得到噪音。

编辑：如果“原始”值实际上不是单字节，则应首先从字节数组转换为这些值，然后然后应用增益，然后再转换回单字节。否则你确实会得到一些奇怪的结果......特别是如果本机格式实际上将字节视为 unsigned 值......

【讨论】：

是的，这正是我所做的。我如何尝试将单个字节转换为短数组的示例：short maskLeft = 0xff00;短 maskRight = 0x00ff;短shortLeft = 数组[i] + 数组[i]>>8;短左 *= 增益；数组[i] = (shortLeft&maskLeft) 抱歉，我不知道如何在此评论字段中设置代码...我将编辑我的问题【参考方案4】：

我在遇到一个非常相似的问题后发现了这篇文章。 FWIW我的问题通过注意到诸如

之类的代码解决了

short sValue = (array[i] + array[i+1] <<8)

不考虑 Java 有符号字节的影响。如果高位设置在低字节中（例如 array[i]），那么这对 short 没有影响，但确实影响分别对 short 的两个字节进行算术运算的代码。通过代码轻松修复

if(array[i] < 0)
    array[i+1] += 1;

将 256 添加到短字节 - 占低字节中缺少的 128 位和其余部分的二进制补码。根据您处理字节数组的方式，您可能需要对此进行一些更改。

【讨论】：

【参考方案5】：

试试这个：

byte[] decodedBuffer = Base64.decode(message64, Base64.NO_WRAP);
       // byte[] newdata;
        for (int i=0; i<decodedBuffer.length; i++) 
            Byte b = decodedBuffer[i];
            if (b<=Byte.MIN_VALUE||b>=Byte.MAX_VALUE) decodedBuffer[i] = Byte.MIN_VALUE;
        
        if (audioTrack != null)
            audioTrack.write(decodedBuffer, 0, decodedBuffer.length);

【讨论】：

以上是关于处理带有小数的字节数组后的 Java Sound API 噪声的主要内容，如果未能解决你的问题，请参考以下文章