转换语音就像将彩色图像转换为灰度?
Posted
技术标签:
【中文标题】转换语音就像将彩色图像转换为灰度?【英文标题】:Converting voice like converting color image to grayscale? 【发布时间】:2011-05-16 09:10:57 【问题描述】:这个问题是未分类的.. 我猜。 我想知道我可以将每个录制的声音转换为一个标准声音以便能够对其进行操作吗?
让我解释一下图像。我有彩色图像,但我知道很难识别字母。所以让我们转换它。我现在可以对灰度图像进行操作。那时我有更多的能力去做这件事。几天我完成了自己的算法识别图片中的字母,所以我有一些经验。 :]
你能给我一些关于将语音转换为我可以轻松工作的语音的好主意或算法吗?编辑1
假设有两个人对着我电脑的麦克风说话。看我的声音和我朋友的声音的图表是不同的。我问,是否有可能将两种声音标准化为一种普遍的声音。如果我编写“嗨! - 由我编写,如果我的女朋友在我的程序中说“嗨!”(用 c# 编写),它将不起作用。
【问题讨论】:
我不确定你在问什么。如何将 CAPTCHA 类型的图像读取为特定的语音? 粗体字是问题 您需要通过语音转文本引擎处理语音,然后使用文本转语音引擎重新生成语音。 【参考方案1】:根据您的更新,我认为您正在寻找语音识别软件和语音合成的组合。 我建议看看 CMUSphinx:http://cmusphinx.sourceforge.net/ 和节日:http://festvox.org/ 分别。
因此,使用语音识别来确定人们在说什么,并使用语音合成将其作为标准“语音”输出。
【讨论】:
以上是关于转换语音就像将彩色图像转换为灰度?的主要内容,如果未能解决你的问题,请参考以下文章
Python 使用skimage实现将彩色图像转换为灰度图像并保存
Python 使用skimage实现将彩色图像转换为灰度图像并保存