如何检测谷歌云平台机器学习语音api中所说的语言

Posted

技术标签:

【中文标题】如何检测谷歌云平台机器学习语音api中所说的语言【英文标题】:how to detect language spoken in google cloud platform machine learning speech api 【发布时间】:2017-10-23 01:48:22 【问题描述】:

是否有使用 Google Cloud Platform Machine Learning 的语音 API 自动检测口语的选项?

https://cloud.google.com/speech/docs/languages表示支持的语言列表,需要用户手动设置此参数才能进行语音转文本。

谢谢 马赫什

【问题讨论】:

【参考方案1】:

从上个月开始,Google 在其语音转文本 API 中增加了对口语检测的支持。 Google Cloud Speech v1p1beta1

但它有点受限 - 您必须提供可能的语言代码列表,最多只能包含 3 个,据说仅支持语音命令和语音搜索模式。如果您知道音频中可能包含哪些其他语言,这将很有用。

来自他们的文档:

alternative_language_codes[]: 字符串

可选 最多 3 个附加 BCP-47 语言标签的列表,列出 提供的音频的可能替代语言。见语言 支持当前支持的语言代码列表。如果 列出替代语言,识别结果将包含 以检测到的最可能语言识别,包括主要语言 语言代码。识别结果将包含语言标签 在音频中检测到的语言。注:此功能仅 支持语音命令和语音搜索用例和性能 其他用例(例如电话转录)可能会有所不同。”

【讨论】:

【参考方案2】:

对 Google Cloud Speech API 的请求需要以下配置参数:encodingsampleRateHertzlanguageCode。 https://cloud.google.com/speech/reference/rest/v1/RecognitionConfig

因此,Google Cloud Speech API 服务无法自动检测所使用的语言。该服务将通过此参数 (languageCode) 进行配置,以开始识别该特定语言的语音。

如果您想与 Google Cloud Translation API 并行,自动检测输入语言,请考虑自动检测音频文件中使用的语言比文本需要更多的带宽、存储空间和处理能力文件。此外,Google Cloud Speech API 提供 Streaming Speech Recognition,这是一种实时语音到文本的服务,特别需要 languageCode 参数。

【讨论】:

以上是关于如何检测谷歌云平台机器学习语音api中所说的语言的主要内容,如果未能解决你的问题,请参考以下文章

谷歌云如何在使用 Python api 创建实例时启动服务?

VM中Panda_gbq导入错误(谷歌云平台虚拟机)

谷歌云文本到语音生成的mp3开头和结尾静音

英特尔携手谷歌云加速最新虚拟机;谷歌云平台下调抽成比例;Hitachi Vantara推出全新云成本优化服务...

通过谷歌云平台的 Tensorboard

如何在谷歌云平台中使用私有 IP 从我的电脑连接到 sql 实例