管理对麦克风输入和系统音量的访问

Posted 2023-02-25

技术标签:

【中文标题】管理对麦克风输入和系统音量的访问【英文标题】：Managed access to microphone input and system volume 【发布时间】：2009-07-28 02:13:18 【问题描述】：

我想做三件事：

从麦克风访问数据。我真的只想知道设备感应到的声音的整体音量。

设置麦克风增益。

设置系统音量。

我所有的 Windows 开发经验都是 C#/WPF，所以我想保持管理。我不需要异常高性能或实时处理或任何东西。

我环顾四周，似乎 SlimDX 可能是一个很好的包装器，但即使在那里我也不确定从哪里开始。

肯定不会那么难吧？

【问题讨论】：

【参考方案1】：

这是一个链接，显示如何从 C# 访问 Windows 中的混音器：

http://www.codeguru.com/csharp/csharp/cs_graphics/sound/article.php/c10931

这将让您设置麦克风增益和系统音量。不过，第一部分稍微复杂一些。基本上，您需要开始记录输入（使用 DirectSound 或 waveInXXXX API [我个人最喜欢的]）。当每个缓冲区都充满音频时，您可以计算缓冲区的均方根并使用它来估计音量。

编辑：这是一个项目链接（我已经成功使用和修改，所以我知道它可以工作），它展示了如何使用 waveInXXXX API 录制音频：

http://www.codeproject.com/KB/audio-video/cswavrec.aspx?df=90&fid=16677&mpp=25&noise=3&sort=Position&view=Quick&select=3005817

编辑 2：因为我已经厌倦了发布链接，这里有一个计算音频缓冲区的均方根的实际公式（这里的类型是 float[]，但它可以是很容易修改以处理 short[]，这是您通常从 waveInXXXX 获得的）：

public static float RootMeanSquared(ref float[] audio)

    double sumOfSquared = 0;
    for (int i = 0; i < audio.Length; i++)
    
        sumOfSquared += audio[i] * audio[i];
    
    return (float)Math.Sqrt(sumOfSquared / (double)audio.Length);

【讨论】：

感谢您提供的信息丰富的回答。但是，一旦我点击“开始”按钮，该示例就会崩溃。哪一个？第一个还是第二个？为什么是浮点数组参数 ref ？价值还不够吗？ @Dreas：我写了很多以 float[] 数组作为参数的函数。通常这些函数只是修改现有的数组，但有时它们要么修改现有的数组，要么创建一个新的更大的数组，这取决于我在做什么（混响就是一个例子）。我必须通过 ref 传递输入才能做到这一点，所以这只是一种习惯。你是对的，这个函数没有 ref 关键字也能正常工作。函数 RootMeanSquared 是正确的，只有信号的平均值为 0，所以它上面没有 continue 分量。通常情况下是这样，但在某些情况下并非如此。【参考方案2】：

不幸的是，除非您愿意忍受严重的延迟（大约 0.5 秒），否则您无法可靠地从托管代码中读取（或呈现）数据。问题是 CLR 可以一次中断您的进程 250 毫秒而不会发出警告。通常这无关紧要，但是当您尝试进行同步处理时，这可能是一个重大问题。

【讨论】：

我编写了一个 C# 应用程序，它 P/Invoked waveIn* 并实时（我认为是）渲染了一个光谱仪。它似乎没有任何如此严重的延迟问题。我只是幸运没有遇到这个问题吗？您可能没有耗尽内存或触发 GC 循环。它还取决于您在哪个操作系统上运行。在 Vista 上，wave API 有大约 100 毫秒的延迟，这使得它们更能抵御故障。在 XP 和 Win7 上，它们以大约 30 毫秒的延迟运行，这更容易出现故障。我正在运行 Vista。谢谢，这是个好东西。我的软件合成器不能实时运行，但我正在考虑编写一个可以实时运行的版本。考虑到我的声音生成过程已经相对昂贵，这种延迟几乎不可能实现（我假设延迟也适用于 waveOut*？）。我认为因为您使用的是 P/Invoke 而不是托管库，所以这不是什么大问题......除非我在这种情况下弄错了，请有人纠正我。 @MahmoudAl-Qudsi 调用本身不会被延迟，因为它是非托管的，但结果的处理可能是......【参考方案3】：

您可以使用 NAudio 在托管 C# 中从麦克风捕获音频。查看演示项目，了解如何执行此操作的示例。正如拉里在上面指出的那样，不要期望有很大的延迟。 NAudio 还为混音器 API 提供了托管包装器，可以让您设置麦克风音量，尽管以编程方式获取正确的控制可能很棘手。

【讨论】：

【参考方案4】：

我刚刚写了一个关于如何capture sound from the microphone using SlimDX 的（非常基本的）示例代码。如果您仍在寻找答案，希望对您有所帮助。

【讨论】：

以上是关于管理对麦克风输入和系统音量的访问的主要内容，如果未能解决你的问题，请参考以下文章

调整麦克风输入音量

Ubuntu Linux下怎样同时对麦克风及系统声音进行录音

访问麦克风后整个应用程序的音量变得更安静

sh 控制OS X麦克风输入音量

Unity控制音量/麦克风的两种方式（系统和程序）

使用 AUGraphs 进行麦克风输入