如何检测谷歌云平台机器学习语音api中所说的语言
Posted
技术标签:
【中文标题】如何检测谷歌云平台机器学习语音api中所说的语言【英文标题】:how to detect language spoken in google cloud platform machine learning speech api 【发布时间】:2017-10-23 01:48:22 【问题描述】:是否有使用 Google Cloud Platform Machine Learning 的语音 API 自动检测口语的选项?
https://cloud.google.com/speech/docs/languages表示支持的语言列表,需要用户手动设置此参数才能进行语音转文本。
谢谢 马赫什
【问题讨论】:
【参考方案1】:从上个月开始,Google 在其语音转文本 API 中增加了对口语检测的支持。 Google Cloud Speech v1p1beta1
但它有点受限 - 您必须提供可能的语言代码列表,最多只能包含 3 个,据说仅支持语音命令和语音搜索模式。如果您知道音频中可能包含哪些其他语言,这将很有用。
来自他们的文档:
alternative_language_codes[]: 字符串
可选 最多 3 个附加 BCP-47 语言标签的列表,列出 提供的音频的可能替代语言。见语言 支持当前支持的语言代码列表。如果 列出替代语言,识别结果将包含 以检测到的最可能语言识别,包括主要语言 语言代码。识别结果将包含语言标签 在音频中检测到的语言。注:此功能仅 支持语音命令和语音搜索用例和性能 其他用例(例如电话转录)可能会有所不同。”
【讨论】:
【参考方案2】:对 Google Cloud Speech API 的请求需要以下配置参数:encoding
、sampleRateHertz
和 languageCode
。
https://cloud.google.com/speech/reference/rest/v1/RecognitionConfig
因此,Google Cloud Speech API 服务无法自动检测所使用的语言。该服务将通过此参数 (languageCode
) 进行配置,以开始识别该特定语言的语音。
如果您想与 Google Cloud Translation API 并行,自动检测输入语言,请考虑自动检测音频文件中使用的语言比文本需要更多的带宽、存储空间和处理能力文件。此外,Google Cloud Speech API 提供 Streaming Speech Recognition,这是一种实时语音到文本的服务,特别需要 languageCode
参数。
【讨论】:
以上是关于如何检测谷歌云平台机器学习语音api中所说的语言的主要内容,如果未能解决你的问题,请参考以下文章
谷歌云如何在使用 Python api 创建实例时启动服务?