MRCPv2在电信智能语音识别业务中的应用

Posted damizhou

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MRCPv2在电信智能语音识别业务中的应用相关的知识,希望对你有一定的参考价值。

1. MRCPv2协议简介

      媒体资源控制协议(Media Resource Control Protocol, MRCP)是一种基于TCP/IP的通讯协议,用于客户端向媒体资源服务器请求提供各种媒体资源服务。此协议是由Cisco、Nuance等公司联合开发,由IETF作为Internet草案发布,经过不断的更新,目前最新的版本为RFC6787,可以支持的媒体资源业务包括文语转换(Text to Speech, TTS)、自动语音识别 (Automatic Speech Recognition, ASR)、录音(Recording)、声纹识别(Voiceprint Recognition, VPR)。

 

2. MRCPv2系统结构及协议控制

      MRCP 协议本身不是独立的,它不仅仅依赖于TCP/IP协议,还依赖于SIP、SDP、RTP、RTCP、RTSP等协议。

      其系统结构如图1所示:

      (1) 控制面:它通过sip协议在客户端(MRCP Client)和服务器(MRCP Server)之间建立和管理会话(注:MRCPv1就使用RTSP协议完成控制,MRCPv2改为sip协议)。

       (2)它通过SDP交换媒体能力以及通过RTP协议完成媒体的承载交换。

        (3)业务面:它通过MRCP协议来控制完成媒体资源服务的相关请求,响应和事件的传递,从而为客户端提供所需要的媒体资源服务。

         其协议控制机制如图2所示:

技术图片

 

         (1)SIP协商过程中,MRCP Client在INVITE消息中携带自身用于传递MRCP协议以及RTP语音流的SDP(IP地址和端口号)。

          (2)在协商成功返回200消息中会带上MRCP Server侧的SDP。

          (3)MRCP Client发起TCP连接创建,并且通过TCP连接上发送MRCP协议控制MRCP Server分配的资源。

           (4)MRCP Client/Server通过在RTP连接上传输语音数据从而实现媒体资源业务。

            (5)当业务应用结束时,终止SIP会话的同时,还需要关闭TCP和RTP连接。

      

    MRCPv2的使用规范可以总结如下:

    (1)MRCP Client 通过SIP&SDP建立与MRCP Server的MRCP控制通道(使用MRCP 通道ID进行唯一标识,MRCP Server返回200消息时,通过a==channel属性指定)

     (2)可以使用SIP的Re-INVITE消息添加或者删除一个会话中的MRCP控制通道,所以一个会话可以拥有多个MRCP控制通道(比如:一个会话可以同时拥有ASR&TTS 通道)

      (3)多个MRCP控制通道可以共享同一个TCP链接。

       (4)一个MRCP消息只能携带一个MRCP通道ID。

       (5)MRCP控制消息不能更改SIP绘话的状态。

       (6)由于MRCP不保证传输的可靠性,所以必须使用TCP来保证其传输。

    

 

以上是关于MRCPv2在电信智能语音识别业务中的应用的主要内容,如果未能解决你的问题,请参考以下文章

语音识别简述

个推漫话数据智能:《女心理师》中的智能语音识别系统如何实现?

个推科普漫画,解读《女心理师》中的智能语音识别系统

个推科普漫画,解读《女心理师》中的智能语音识别系统

简要!语音识别

人工智能 1. 语音合成,语音识别,相似度,图灵机器人,智能对话