多种汉语方言语音落地应用,微软智能语音解锁更多交互场景
Posted AI科技大本营
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了多种汉语方言语音落地应用,微软智能语音解锁更多交互场景相关的知识,希望对你有一定的参考价值。
多年来,微软持续探索 AI 语音合成与识别技术,获得了大量成果:Azure Neural TTS(text-to-speech,语音合成)与 STT(speech-to-text,语音识别)支持的语言区域达到 140 余个,并支持超过 400 多个音色,并具有丰富细腻的情感,与真人声音不相伯仲。目前,微软智能语音已赋能超过 100 个国家合作伙伴的产品及服务,共同打造了语音交互生态。
近两年,微软在汉语方言智能语音上加大了研究力度,在语音合成上实现了对吴方言和粤方言两种汉语方言,以及西南官话、东北官话、冀鲁官话、中原官话(包括河南、陕西地区)等多种官话次方言的支持;在语音识别上支持吴方言、粤方言和西南官话,受到了众多企业客户的青睐,也得到了终端用户的认可。
值此辞旧迎新之际,微软智能语音为大家送上新春祝福!一起感受方言朗读的独特魅力。
中原官话(河南)音频:
https://ttspublic.blob.core.windows.net/nickzhao/yuanri-henan.wav
中原官话(河南)朗诵的北宋王安石的《元日》
方言版智能语音需求日益增多
在智能家居领域,使用智能语音控制空调、电视、电灯等家居产品已经越来越常见。在与智能机器人的对话中,人们往往需要使用标准普通话以得到准确的反馈,但一些习惯使用方言的用户群体——比如家中的老人可能更倾向使用方言进行交流。因此,若智能家居企业在产品中引入方言语音,便能更好地满足人们对不同方言使用的需求。
以吴方言(上海)与智能空调进行交互:
吴方言(上海)音频:
https://ttspublic.blob.core.windows.net/nickzhao/shanghai.wav
侬好,已为侬打开空调,并将温度调低至 25 度。稍后还有其它需要,可以随时呼叫我。
在智能导航领域,各大地图厂商将"声音"作为吸引客户的重要卖点,纷纷推出了明星语音包、幽默风趣的相声语音包等等。近两年,越来越多的用户认为方言会让他们感觉更亲切、熟悉,也更容易理解。
以东北官话(辽宁)进行的语音导航:
东北官话(辽宁)音频:
https://ttspublic.blob.core.windows.net/nickzhao/liaoning.wav
我们已经驶入 2022 年冬季,冬天常常与雪为伴,温度将至零下,路面易结冰,所以请减速减速再减速。注意两百米后有一个小小的急转弯,但道路湿滑也容易让你漂移,请收油慢行。前方路口行人较多,还请踩下刹车,不要让它成为摆设。
在影视配音中,来自众多地域的不同角色,有时需要搭配方言才能更好地呈现人物形象。比如,角色设定来自东北,性格热情豪爽、快言快语,如果以普通话配音,就失去了特色;再比如,在美食介绍节目中,针对不同的菜系搭配当地的特色方言,更能引起人们的共鸣,想象中就能口齿生津。
以西南官话(四川)介绍美食:
西南官话(四川)音频:
https://ttspublic.blob.core.windows.net/nickzhao/sichuan.wav
重庆火锅以麻、辣、烫、鲜、香、嫩、脆著称,然而正宗的重庆火锅究竟应该烫啥子才巴适?鲜脆毛肚、爽滑鸭肠必不可少,富有嚼劲;剁椒嫩牛肉不可错过,双椒口感鲜辣十足;井水豆芽口感独特,石磨黑豆腐鲜香四溢,清爽荷心香甜解腻。
除了上述场景外,微软智能语音也已经在呼叫中心、新闻阅读等众多场景中应用。越来越多的企业对方言智能语音有需求,包括智能汽车、智能手机等企业对语音助理、呼叫中心的方言场景规划,以及(短)视频配音等等。
保护并传承传统文化,微软持续
致力于方言与诗歌智能语音的研究
汉语是世界上最古老的语言之一,受历史与地理条件的影响,出现了众多代表地域文化特色的方言。自 2017 年起,微软一直致力于 AI for Good 计划的推进,其中包括:通过提供前沿的技术、资源和专业知识,保护人文遗产以及创造更具可持续性和便利性的世界。微软也将持续投入于方言智能语音的研究,助力中国传统文化的保护与传承。
在方言之外,古典诗歌也是文化传承的重要载体。微软通过学习大量诗歌朗诵者的语音数据,可以让 AI 更好地表达诗歌的韵律、停顿、情感。微软可支持传统诗歌、现代诗歌、五言、七言律等智能语音的朗诵。
中原官话(陕西)朗诵唐朝李世民的《守岁》:
中原官话(陕西)音频:
https://ttspublic.blob.core.windows.net/nickzhao/shousui-shaanxi.wav
《守岁》,唐,李世民。暮景斜芳殿,年华丽绮宫。寒辞去冬雪,暖带入春风。阶馥舒梅素,盘花卷烛红。共欢新故岁,迎送一宵中。
从智能家居到车载语音助手,从呼叫中心转写到多人会议记录,微软智能语音技术不断打破场景限制,让人工智能以各种各样的声音形象来丰富人们的工作和生活。未来,微软智能语音还将扩展覆盖更多全球语言和方言,持续提升模型质量、准确度,尽全力满足区域用户的个性化、差异化定制需求,为使用者提供更好的语音服务,解锁更多交互场景。
附:汉语方言通常分为十大方言:官话方言、晋方言、吴方言、闽方言、客家方言、粤方言、湘方言、赣方言、徽方言、平话土话。各方言区内又分布着若干次方言和许多种“土语”。其中使用人数最多的官话方言可分为东北官话、北京官话、冀鲁官话、胶辽官话、中原官话、兰银官话、江淮官话、西南官话八种次方言。
来源:中国语言文字概况(2021 年版)
http://www.moe.gov.cn/jyb_sjzl/wenzi/202108/t20210827_554992.html
以上是关于多种汉语方言语音落地应用,微软智能语音解锁更多交互场景的主要内容,如果未能解决你的问题,请参考以下文章
音箱语音交互技术,乐鑫ESP32-H2芯片应用,无线WiFi芯片模组