如何检测谷歌云平台机器学习语音api中所说的语言

Posted 2023-04-19

技术标签:

【中文标题】如何检测谷歌云平台机器学习语音api中所说的语言【英文标题】：how to detect language spoken in google cloud platform machine learning speech api 【发布时间】：2017-10-23 01:48:22 【问题描述】：

是否有使用 Google Cloud Platform Machine Learning 的语音 API 自动检测口语的选项？

https://cloud.google.com/speech/docs/languages表示支持的语言列表，需要用户手动设置此参数才能进行语音转文本。

谢谢马赫什

【问题讨论】：

【参考方案1】：

从上个月开始，Google 在其语音转文本 API 中增加了对口语检测的支持。 Google Cloud Speech v1p1beta1

但它有点受限 - 您必须提供可能的语言代码列表，最多只能包含 3 个，据说仅支持语音命令和语音搜索模式。如果您知道音频中可能包含哪些其他语言，这将很有用。

来自他们的文档：

alternative_language_codes[]: 字符串

可选最多 3 个附加 BCP-47 语言标签的列表，列出提供的音频的可能替代语言。见语言支持当前支持的语言代码列表。如果列出替代语言，识别结果将包含以检测到的最可能语言识别，包括主要语言语言代码。识别结果将包含语言标签在音频中检测到的语言。注：此功能仅支持语音命令和语音搜索用例和性能其他用例（例如电话转录）可能会有所不同。”

【讨论】：

【参考方案2】：

对 Google Cloud Speech API 的请求需要以下配置参数：encoding、sampleRateHertz 和 languageCode。 https://cloud.google.com/speech/reference/rest/v1/RecognitionConfig

因此，Google Cloud Speech API 服务无法自动检测所使用的语言。该服务将通过此参数 (languageCode) 进行配置，以开始识别该特定语言的语音。

如果您想与 Google Cloud Translation API 并行，自动检测输入语言，请考虑自动检测音频文件中使用的语言比文本需要更多的带宽、存储空间和处理能力文件。此外，Google Cloud Speech API 提供 Streaming Speech Recognition，这是一种实时语音到文本的服务，特别需要 languageCode 参数。

【讨论】：

以上是关于如何检测谷歌云平台机器学习语音api中所说的语言的主要内容，如果未能解决你的问题，请参考以下文章

谷歌云如何在使用 Python api 创建实例时启动服务？

VM中Panda_gbq导入错误（谷歌云平台虚拟机）

谷歌云文本到语音生成的mp3开头和结尾静音

通过谷歌云平台的 Tensorboard

如何在谷歌云平台中使用私有 IP 从我的电脑连接到 sql 实例