WebRTC 通信原理

Posted 2023-05-17

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了WebRTC 通信原理相关的知识，希望对你有一定的参考价值。

参考技术A 在不同的网络环境(带有摄像头/麦克风多媒体设备)中，为两个浏览器实现点对点实时视频/语音通信有什么困难?

1、了解对方的媒体格式、支持的最大分辨率和其他媒体信息？

2、要了解彼此的网络，就有可能找到一条通信链路？

3、两个终端还没有建立连接时,如何交换“媒体信息”和“网络信息”呢?

为了保证两端都有正确的编码和解码，最简单的方法就是取它们的交集H264

注:有一种特殊的协议叫做Session Description protocol (SDP)，可以用来描述上述信息。

在webrtc中，参与视频通信的双方必须首先交换SDP信息，这样双方才能了解基本的SDP交换过程。

同样，在复杂的网络环境中，要在两端之间建立连接，必须有一个双方都可以访问的链路。

从图中可以看出，他们可以使用公用网段192沟通。

在web brtc通信过程中，这些与网络相关的信息也必须进行交换，以找到共同的交集。这个过程也被称为“网络协商”。

两个终端还没有建立连接时,如何交换“媒体信息”和“网络信息”呢?

此时，所谓信号服务器信号服务器应该出现:

如上图所示,两个浏览器可以抽象的上层一层信令服务器(可以是一个或多个,根据实际的应用程序中,如果两个浏览器可以访问公共网络环境,如公共如果没有公共网络环境中,您可以设置一组服务器两端,即信号服务器A和信号服务器B，但这两套信令服务器必须能够相互通信)，在信令服务器的帮助下，可以实现上述SDP信息和网络信息的交换。

交换SDP的过程大致如图所示:

1. Amy(假设一个人的名字)通过setLocalDescription方法保存自己的SDP信息，然后通过offer方法发送给信令服务器。

2. 信息服务器将Amy的SDP转发给另一端的Bob(另一个虚构的名字)，Bob将首先调用setremotedescription来保存Amy的SDP。

3.然后Bob调用setLocalDescription方法来保存他的SDP，然后使用answer方法通过信令服务器将他的SDP发送给Amy

4. Amy收到Bob的SDP后，调用setRemoteDescription进行保存，双方完成SDP交换，找到交集。如果他们能达成协议，他们就可以建立一个p2p连接并开始通信。

但现实往往是残酷的。在中国的网络环境下，据统计，至少有一半的网络不能直接连接。我个人认为根本原因是:在互联网发展的早期，绝大多数IP4地址资源都被国外所占据。当轮到中国等发展中国家使用IP地址时，大多数计算机没有公网IP地址，只能通过路由器和交换机进行NAT转换，相当一部分NAT是对称的。基本上，没有办法播放它。在这种情况下，您只能使用前一节提到的转向服务器进行转移。此外，在视频对话框中，通常会有房间(或组)的概念，用来隔离一些服务。这部分逻辑也在信号服务器中实现。对端、信令服务器、stun/转接服务器后，整个1对1实时视频通信顺序图如下:

主要流程如下:

1. 双方首先调用getUserMedia打开本地摄像头

2. 向信令服务器发送apply_join请求以加入房间

3.信令服务器通知我成功加入(joined)，同时向其他人广播加入消息(other_joined)

4. 第二个端开始创建peerConnection连接

5. PeerB创建报价，同时将SDP保存到本地机器(setLocalDescription)，并通过信令服务器将SDP传递给peerA

6. 在setLocalDescription之后，PeerB将异步触发“候选网络链接”的集合，这大致决定了它自己所有的NAT映射通过Stun退出。如果Stun返回的NAT是“对称的”，它将基本上无法穿透。再次通过Turn得到中继应答地址，并通过信令服务器将网络候选链接信息发送给peerA(即:启动网络协商)

7. peerA收到peerB的SDP后，开始响应(createAnswer)，仍然通过信令服务器将SDP发送给peerB

8. 同时，peerA也会开始收集网络候选链路，并通过信令服务器(即网络协商)将自己的网络信息发送给peerB。

通过这种方式，peerA和peerB相互交换了媒体信息和网络信息。如果他们能达成一致(即找到交叉点)，他们就能开始沟通。

WebRTC技术专题大势所趋，迈向认识 WebRTC 的第一步

每日一句

人生的挑战，无处不在，满怀信心，轻装上路，明天永远是充满希望的战场。

承接上文

承接上文的内容介绍完相关WebRTC技术的概念和发展历程后，开始初步摸索一下相关WebRTC技术的功能和原理。

技术回顾

WebRTC概念定义

WebRTC名称源自网页实时通信（Web Real-Time Communication）的缩写，是一个支持网页浏览器进行实时语音对话或视频对话的技术，是谷歌2010年以6820万美元收购Global IP Solutions公司而获得的一项技术。

WebRTC功能范畴

WebRTC是一个开源项目，旨在使得浏览器能为实时通信（RTC）提供简单的 JavaScript接口。
WebRTC不仅可传输视频，也可以传输其他数据例如文本、图片等。需要注意的是，WebRTC并不是浏览器的一个子集，浏览器只是根据 WebRTC 的标准协议实现了 WebRTC的原生接口。Android 和 IOS 系统也支持 WebRTC 。

WebRTC应用包括下面四个主要的概念

信令服务器（Signalling servers）
ICE服务器（ICE servers）
媒体服务器（Media servers）
JavaScript接口（JavaScript API）

WebRTC已经纳入HTML5标准

目前支持WebRTC协议的浏览器有：Chrome、Firefox Opera，IE不支持~

WebRTC没有指定具体的信令协议，具体的信令协议留给应用程序实现。
WebRTC使用JSEP协议建立会话，什么是JSEP后面说
WebRTC采用ICE实现NAT穿越。
WebRTC客户端之间可以进行点对点的媒体传输。

WebRTC的核心组件

音视频引擎：OPUS、VP8/VP9、H264
传输层协议：底层传输协议为UDP
媒体协议：SRTP/SRTCP
数据协议：DTLS/SCTP
P2P内网穿透：STUN / TURN / ICE / Trickle ICE
信令与SDP协商：HTTP / WebSocket / SIP、 Offer Answer 模型

下图为WebRTC内部结构简化图：

最底层是硬件设备。
上面是音频捕获模块和视频捕获模块。

中间部分为音视频引擎：
- 音频引擎负责音频采集和传输，具有降噪、回声消除等功能。
- 视频引擎负责网络抖动优化，互联网传输编解码优化。

在音视频引擎之上是一套C++ API，在C++ 的API之上是提供给浏览器的Javascript API。

【学习地址】：FFmpeg/WebRTC/RTMP/NDK/Android音视频流媒体高级开发
【文章福利】：免费领取更多音视频学习资料包、大厂面试题、技术视频和学习路线图，资料包括（C/C++，Linux，FFmpeg webRTC rtmp hls rtsp ffplay srs 等等）有需要的可以点击1079654574加群领取哦~

JSEP

JSEP（JavaScript Session Establishment Protocol，JavaScript会话建立协议）是一个信令API，允许开发者构建更强大的应用程序以及增加在信令协议选择上的灵活性。
JSEP是干什么的呢，一方面提供接口如createOffer()供web应用程序调用生成SDP，另一方面提供ICE功能接口。这些功能都由浏览器实现，浏览器WebRTC传输信令（offer/answer）采用Websocket。
- 建立会话最关键的就是媒体的协商，WebRTC虽然没有指定具体的信令协议，但是媒体协商采用了SDP协议。
- 如果web应用程序不使用额外的信令协议，仅使用JSEP，两个WebRTC client（同一个WebRTC client程序，两处登陆）之间也是可以建立链接的，即只要应用程序能解析用WS传递过来的Offer/Answer消息，提取出其中的SDP和ICE信息就可以了。
github上codelabdemo就是不用其他信令协议，直接使用JSEP生成offer/answer信令，然后采用ws协议传输实现的。
JSEP并不是信令协议，可以在JSEP的基础上引入SIP等信令协议，使WebRTC应用功能更加完备。

信令服务器

信令服务器主要用于在两个用户之间交换信息。虽然WebRTC是点对点通信，但还是需要服务器来初始化连接，并传递一些信息。

WebRTC没有定义用于建立信道的信令的协议，因此可以使用任意的传输方式，例如 WebSocket, XMPP, SIP, AJAX。

可以使用实时的传输协议比如WebSocket来交换数据，也可以使用简单的 GET/POST方式轮询服务器来获取数据。

信令服务器传送的数据有

协商媒体功能和设置
标识和验证会话参与者的身份
控制媒体会话、指示进度、更改会话和终止会话

其中只有第一项的必备功能。其他都可以根据业务需求自由调整。

SDP协议

媒体协商最重要的功能在于，为参与点对点通信的两个浏览器之间交换会话描述协议「SDP」。
「SDP」包含浏览器的RTP媒体栈配置所需的全部信息，包括媒体类型（音频、视频、数据）、所需的编解码器，用于编解码器参数或设置，以及有关带宽的信息。

此外，信令通道还用于交换候选地址，以便进行ICE打洞。

信令互通方案

WebRTC与SIP互通

要想让WebRTC与SIP互通，要解决两个层面的问题：信令层和媒体层。

两个网络使用的信令机制不同，所以要进行信令的转换，才能完成媒体的协商，建立会话。媒体层要完成编码的转换，以及RTP/SRTP转换等功能。

这里主要说项信令层面的互通。

目前SIP和WebRTC信令上互通有两种解决方案：

JavaScript实现SIP协议栈，WebRTC应用程序基于这个协议栈开发。WebRTC Client发出的信令就是SIP信令，但一般采用websocket为信令传输协议。
- 这样WebRTC client就可以直接注册到支持WS的SIP Server上了。jssip 、sipml5都是这种解决方案。
通过转换网关实现协议的转换，从而互通。一个开源的网关项目就是 WebRTC2SIP。
- WebRTC2SIP是一个功能很完善的网关，既实现了信令层，也实现了媒体层，编码转换功能很强大，也可以直接当做媒体网关，用于编解码，沟通两端的媒体。

ICE服务器

实现点对点通信的关键在于两个浏览器之间能直接发送和接收数据包，但一般情况下，浏览器或手机都是通过路由器访问Internet，所以存在网络地址转换（NAT）。
NAT之内的IP地址是私有地址，外部无法访问。分配给NAT的IP地址才是公共地址。NAT每次从内部到外部转发数据包时都使用公共地址。
交互式建立连接（ICE）是一种标准穿透协议，它利用STUN和TURN服务器来建立连接。
STUN服务器可以遍历NAT，获取浏览器的候选地址，包括私有地址、外层NAT的公共 IP地址等。
通信信令通道可以交换候选地址，浏览器一旦发送并收到了候选地址，就会开始进行连接检查，若检查成功，便使用该候选项发送媒体。
在大多情况下，通过穿透可以建立直接对等连接。但是，若NAT或防火墙限制非常严格，无法建立连接，就只能通过TURN服务器中继媒体。

媒体服务器

媒体服务器不是必须的，但在多方会话或需要对媒体做额外处理的情况下可以考虑加入。对于有多个浏览器参与的会议，可以采用一个集中式媒体服务器。在这种情况下，美国浏览器都只需与媒体服务器建立单个连接即可，这种结构的优势是额能够扩展非常大的会话，同时可以在最大限度上减少当有新加入者加入会话事美国浏览器所需的处理工作量。同时，媒体服务器也可对媒体进行分析、处理、保存等工作。

JavaScript接口

getUserMedia

通过调用navigator.getUserMedia()可以获取视频或音频的数据，constraints 参数可以选择是否获取视频音频。下面是一个简单的示例

var constraints = 
  audio: false,
  video: true
;
var video = document.querySelector('video');

function successCallback(stream) 

  if (window.URL) 
    video.src = window.URL.createObjectURL(stream);
   else 
    video.src = stream;
  


function errorCallback(error) 
  console.log('navigator.getUserMedia error: ', error);



navigator.getUserMedia(constraints, successCallback, errorCallback);

RTCPeerConnection

RTCPeerConnection是WebRTC中最重要的一个接口，用于确定ICE服务器、交换 SDP。连接过程如下：

创建RTCPeerConnection对象

RTCPeerConnection的参数用于确定ICE服务器，下面是使用了 google 开放的 STUN 服务器

let iceServer = 
    "iceServers": [
        "url": "stun:stun.l.google.com:19302"
    ]
;
let pc = new RTCPeerConnection(servers);

2.将媒体流放入 RTCPeerConnection 对象中

pc.addStream(localStream);

通过offer和answer交换SDP描述符

甲和乙各自建立一个PC实例
- 甲通过PC所提供的createOffer()方法建立一个包含甲的SDP描述符的offer信令。
- 甲通过PC所提供的setLocalDescription()方法，将甲的SDP描述符交给甲的PC实例。
甲将offer信令通过服务器发送给乙
- 乙将甲的offer信令中所包含的的SDP描述符提取出来，通过PC所提供的 setRemoteDescription()方法交给乙的PC实例
- 乙通过PC所提供的createAnswer()方法建立一个包含乙的SDP描述符 answer信令
- 乙通过PC所提供的setLocalDescription()方法，将乙的SDP描述符交给乙的PC实例
乙将answer信令通过服务器发送给甲

甲接收到乙的answer信令后，将其中乙的SDP描述符提取出来，调用setRemoteDescripttion()方法交给甲自己的PC实例。

ICE打洞

1.当网络候选可用时，通过信令服务器将其发送到对方浏览器

pc.onicecandidate = function(event) 
  if (event.candidate) 
    sendToServer(event.candidate)
  
;

2.当接受到对方网络候选时，将其加入

let candidate = new RTCIceCandidate(candidate);
pc.addIceCandidate(candidate);

3.监听对方发送的媒体是否可用，并播放媒体

pc.onaddstream = event => 
  remoteVideo.src = window.URL.createObjectURL(event.stream);

RTCDataChannel

RTCDataChannel是RTCPeerConnectionAPI的一部分，只有在创建了 RTCPeerConnection实例后才能创建数据通道。

数据通道可以用于发送文本或是文件。

pc = new RTCPeerConnection();
dc =  pc.createDataChannel('dc');
dc.onmessage = event => console.log(event.data);
dc.send('text');
dc.sed(new arraybuffer(32))

在另一端可以使用 ondatachannel 获得 RTCDataChannel 对象

pc.ondatachannel = event => dc = event.channel;

以上是关于WebRTC 通信原理的主要内容，如果未能解决你的问题，请参考以下文章