MRCPv2在电信智能语音识别业务中的应用
Posted damizhou
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MRCPv2在电信智能语音识别业务中的应用相关的知识,希望对你有一定的参考价值。
1. MRCPv2协议简介
媒体资源控制协议(Media Resource Control Protocol, MRCP)是一种基于TCP/IP的通讯协议,用于客户端向媒体资源服务器请求提供各种媒体资源服务。此协议是由Cisco、Nuance等公司联合开发,由IETF作为Internet草案发布,经过不断的更新,目前最新的版本为RFC6787,可以支持的媒体资源业务包括文语转换(Text to Speech, TTS)、自动语音识别 (Automatic Speech Recognition, ASR)、录音(Recording)、声纹识别(Voiceprint Recognition, VPR)。
2. MRCPv2系统结构及协议控制
MRCP 协议本身不是独立的,它不仅仅依赖于TCP/IP协议,还依赖于SIP、SDP、RTP、RTCP、RTSP等协议。
其系统结构如图1所示:
(1) 控制面:它通过sip协议在客户端(MRCP Client)和服务器(MRCP Server)之间建立和管理会话(注:MRCPv1就使用RTSP协议完成控制,MRCPv2改为sip协议)。
(2)它通过SDP交换媒体能力以及通过RTP协议完成媒体的承载交换。
(3)业务面:它通过MRCP协议来控制完成媒体资源服务的相关请求,响应和事件的传递,从而为客户端提供所需要的媒体资源服务。
其协议控制机制如图2所示:
(1)SIP协商过程中,MRCP Client在INVITE消息中携带自身用于传递MRCP协议以及RTP语音流的SDP(IP地址和端口号)。
(2)在协商成功返回200消息中会带上MRCP Server侧的SDP。
(3)MRCP Client发起TCP连接创建,并且通过TCP连接上发送MRCP协议控制MRCP Server分配的资源。
(4)MRCP Client/Server通过在RTP连接上传输语音数据从而实现媒体资源业务。
(5)当业务应用结束时,终止SIP会话的同时,还需要关闭TCP和RTP连接。
MRCPv2的使用规范可以总结如下:
(1)MRCP Client 通过SIP&SDP建立与MRCP Server的MRCP控制通道(使用MRCP 通道ID进行唯一标识,MRCP Server返回200消息时,通过a==channel属性指定)
(2)可以使用SIP的Re-INVITE消息添加或者删除一个会话中的MRCP控制通道,所以一个会话可以拥有多个MRCP控制通道(比如:一个会话可以同时拥有ASR&TTS 通道)
(3)多个MRCP控制通道可以共享同一个TCP链接。
(4)一个MRCP消息只能携带一个MRCP通道ID。
(5)MRCP控制消息不能更改SIP绘话的状态。
(6)由于MRCP不保证传输的可靠性,所以必须使用TCP来保证其传输。
以上是关于MRCPv2在电信智能语音识别业务中的应用的主要内容,如果未能解决你的问题,请参考以下文章