http1.X与2.0

Posted ljohn

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了http1.X与2.0相关的知识,希望对你有一定的参考价值。

HTTP

HTTP 1.X

  1. HTTP是建立在TCP协议上的,HTTP协议的瓶颈及优化都是基于TCP协议本身的特性。

  2. TCP建立连接时有三次握手 会有1.5RTT的延迟,为了避免每次请求都经历握手待来的延迟,应用层会选择不同策略的http长连接。

HTTP 1.0 连接不能复用以及有head of line blocking问题。

http1.0协议头里可以设置Connection:Keep-Alive。在header里设置Keep-Alive可以在一定时间内复用连接,具体复用时间的长短可以由服务器控制,一般在15s左右。到http1.1之后Connection的默认值就是Keep-Alive,如果要关闭连接复用需要显式的设置Connection:Close。
<br />
head of line blocking会因为一个request没有到达服务器或者一个response因为网络没有及时返回而影响后续所有请求。

连接复用问题

tcp长链接
http long-polling

客户端在初始状态会发送一个polling请求到服务器,服务器并不会马上返回业务数据,而是等待有新的业务数据产生时返回。所以连接会被保持,一旦结束马上又会发起一个新的polling请求,反复如此。

http streaming

与long-polling不同,server并不会结束初始的streaming请求,而是持续的通过这个通道返回最新的业务数据,但这个通道时单向的。

web socket

与传统的 tcp socket连接相似,也是基于tcp协议,并提供双向的数据通道。

解决head of line blocking

http pipelining

让每个请求不用等待其他请求的response返回之后才发出,而是几乎在同一时间把request发送给服务器。

SPDY

http 1.X存在诸多问题,在尝试了各种优化手段后提出的SPDY方案。

SPDY目标

  • 降低延迟,客户端的单连接单请求,server的FIFO响应队列都是延迟的大头。
  • http最初设计都是客户端发起请求,然后server响应,server无法主动push内容到客户端。
  • 压缩http header,http1.x的header越来越膨胀,cookie和user agent很容易让header的size增至1kb大小,甚至更多。而且由于http的无状态特性,header必须每次request都重复携带,很浪费流量。

SPDY基础功能

  • 多路复用。多路复用通过多个请求stream共享一个tcp连接的方式,解决了http 1.x hold of line blocking 的问题,降低了延迟同时提高了带宽的利用率。
  • 请求优先级。多路复用带来一个新的问题,在连接共享的基础上可能导致一些关键请求被阻塞。
  • header压缩。 http1.X的 header很多时候都是重复多余的。选择合适的压缩算法可以减小包的大小和数量。

SPDY高级功能

  • server推送。 http1.x只能由客户端发起请求,然后服务器被动的发送response。开启server push之后,server通过X-Associated-Content header告知客户端会有新的内容推送过来。
  • server暗示。 和server push不同的是,server hint并不会主动推送内容,只是告诉有新的内容产生,内容的下载还是需要客户端主动发起请求。server hint通过X-Subresources header来通知。

HTTP 2.0

  • 客户端向server发送request这种基本模式不会变。
  • 老的scheme不会变,使用http://和https://的服务和应用不会要做任何更改。
  • 使用http1.x的客户端和服务器可以无缝的通过代理方式转接到http2.0 上
  • 不识别http2.0的代理服务器可以将请求降级到http1.x

HTTP 2.0主要改动

新的二进制格式

http 1.x是明文协议,格式由strat line,header,body组成。需要做协议解析来识别这3哥部分,http1.x的解析是基于文本的,而文本格式解析存在天然缺陷,二进制比文本格式更方便且健壮。


http 2.0的格式定义更接近tcp。由Length,Type,Flags,Stream ID,Payload5个部分组成。

  • length定义了整个frame的开始到结束
  • type定义frame的类型
  • flags用bit位定义了一些重要的参数
  • stream id用作流控制
  • payload就是request的正文

连接共享

stream id 作用就是连接共享机制,一个request对应一个stream并分配一个id,这样一个连接上可以有多个stream,每个stream的frame随机混杂在一起,接收方根据stream id将frame再归属到各自不同的request里面。每个stream都可以设置优先级和依赖。

header压缩

http2.0使用encoder来减少需要传输的header大小,通讯双方各自cache一份header fields表,避免重复header传输,减少传输大小。

压缩算法选择

SPDY/2使用的是gzip 压缩算法,后来出现BREACHCRIME 2种攻击方式,即使走SSL的SPDY也可以破解内容,http2.0采用HPACK的压缩算法。

重置连接表现

对于http 1.x来说,是通过设置tcp segment里的reset flag来通知对端关闭连接。http2.0引入RST_STREAM 类型的frame,可以在不断开连接的前提下取消某个request的stream。

流量控制

http2.0 通过类似receive window的做法,数据的接收方通过告知对方自己的flow window大小表明自己还能接收多少数据。只有Data类型的 frame才有流量控制功能。

服务推送

http2.0 通过push的方式将客户端需求的内容预先推送过去,也叫cache push。如果客户端退出,需取消server push,可以通过发送RST_STREAM类型的frame来做到。

Nagle Algorithm/TCP Delayed Ack

Nagle Algorithm/TCP Delayed Ack是一组对立的算法。http2.0可以通过TCP_NODELAY禁用Nagle或TCP_QUICKACK禁用ACK。官方推荐设置TCP_NODELAY

更安全的SSL

HTTP2.0使用了tls的拓展ALPN来做协议升级,除此之外加密这块还有一个改动,HTTP2.0对tls的安全性做了近一步加强

以上是关于http1.X与2.0的主要内容,如果未能解决你的问题,请参考以下文章

HTTP 2.0与OkHttp

(纯干货)HTTP/1.0/1.1/2.0的区别以及http和https的区别

深入理解http1.xhttp 2和https

超强反爬虫方案!Requests 什么的通通爬不了

超强反爬虫方案!Requests 什么的通通爬不了

HTTP2的新特性