谷歌开放语音识别 API,对抗 Nuance

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了谷歌开放语音识别 API,对抗 Nuance相关的知识,希望对你有一定的参考价值。

  

技术分享

 

  谷歌正计划向第三方开发者提供自身的语音识别API与Nuance公司和其他语音识别公司迎面竞争。为了吸引广大开发者,该应用将在日后免费推出。

  我们几乎每周都会听到关于服务发展行业的杂音。谷歌这次的决定是在它的NEXT云计算用户大会上宣布的,此次大会上,它同时也推出了其他学习机的改进和更新计划,最显著的是这次可是一个全新的机器学习平台。

  谷歌的这次的云语音API将覆盖超过80种语言,并且该应用支持实时和批量处理模式,它以“看,听和翻译,”的方式为该应用提供了一整套的API。谷歌说,它与谷歌键盘的语音搜索和语音输入应用相比,它是基于同样的神经网络技术的。当然它还有一些其他有趣的特性,比如在嘈杂的环境中它仍然能够实时工作。

  谷歌的这次举动将会对该行业有很大的影响 - 特别是Nuance,Nuance早就想到了提供业界最好的语音识别能力,并且也是此类服务得最大提供商。许多Nuance的客户,包括创业公司,可以会抛弃Nuance从而选择支持谷歌的技术,因为它不仅给当前用户提供了更佳的体验,同时也是目前成本较低的一个。

  最初为了吸引开发者的兴趣,该API将是完全免费使用。过了一段时间后,该API将可能需要支付一个低成本的定价,这一点我们当然可以理解。谷歌方面可能会选择过一段时间,等它成为同行业的龙头老大后再次提高这些价格。

  谷歌在它产品更新后,已经为它的语音技术提供了有限的访问权限。开发者可以利用javascript调用到Chrome的API,例如,之后将其发送到语音识别的API。同时谷歌在2015年宣布了开放一个Google I/O的语音交互API,这使得android开发者能够将语音交互添加到他们的应用中。但谷歌还没有直接开放它们进入语音识别的API。

  语音API介绍将不仅会影响到Nuance公司和其他语音识别提供商,同时也被看作是对苹果的攻击,因为苹果的虚拟助理Siri所拥有的语音识别功能也是谷歌的对手。Siri也没有为了开发者能够让自己的应用使用Siri技术而提供自己的API。

  谷歌将会更加强调它的语音技术和并且提供许多使用案例。例如,该公司在二月份宣布,它将允许谷歌文档的用户通过语音编辑和格式化他们的文档。

  想了解更多请持续关注,我们将在活动中听到您的想法。

  名片印刷http://www.biyinjishi.com/

以上是关于谷歌开放语音识别 API,对抗 Nuance的主要内容,如果未能解决你的问题,请参考以下文章

一个Nuance 的语音识别的例子

关于语音识别的 Android 附加功能不起作用

如何解释语音识别的技术原理?

一段讯飞百度等语音识别API无法识别的语音最终解决办法

语音识别会引发未知值错误

谷歌语音识别 API