HTTP协议压缩格式和URL编码介绍

Posted 小博测试成长之路

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HTTP协议压缩格式和URL编码介绍相关的知识,希望对你有一定的参考价值。

HTTP压缩是指web服务器和浏览器之间压缩传输请求响应结果的方法,通过采用通用的压缩算法,将数据包压缩后进行传输,从而提升页面加载速度,给用户一个更好的体验。



1

HTTP压缩过程 


数据包压缩的过程,其实就是客户端发请求的时候先告诉服务器,我能支持某种算法的压缩,服务端获取到这个参数后,按照特定的格式将原有的响应结果压缩后返回客户端,客户端再进行解码。大致有几下几个步骤:

1、客户端发请求给服务端,在请求中的Header中,在Accept-Encoding中告诉服务端自己支持那种格式压缩

2、服务端收到请求后,得到原始响应结果,通过压缩算法(比如gzip)对响应结果进行编码,然后在响应Header中加入Content-Encoding:gzip,把结果返回给客户端

3、客户端接收到响应结果后,根据Content-Encoding的内容对结果进行解码,获得解压后的内容,然后呈现在页面。




2

HTTP内容编码类型介绍 


HTTP定义了一些表中的内容编码类型,主要有以下几种:

  • gzip:表明实体采用GNU zip编码

  • compress:表明实体采用UNIX的文件压缩程序

  • deflate:表明实体是用zlib的格式压缩的

  • identify:表明没有对实体进行编码,Header中默认选项就是identify


gzip是如何压缩的?

简单来说,gzip就是在一个文本文件中找出类似的字符串,然后临时替换他们,从而使整个文件变小,比较适合压缩hrml、css、js等文件,对图片类的压缩效果不明显。

gzip在工作中运用的还是挺多的,比如手机上访问的H5轻应用报表,如果采用在线的方式加载的话,每次点击的时候都要去请求相关的js之类的,弱网的时候容易白屏,这个时候就可以把相关需要的js资源文件用gzip压缩打包,采用离线加载的方式进行页面加载,同时也提升了用户体验,避免了一些由于网络不稳定带来的体验性问题。



3

URL Encode介绍 



使用python脚本对某个字符串进行url编码解码:

import urllibstr='%E4%BD%A0%E5%A5%BD'print(urllib.unquote(str)) #你好print(urllib.quote("你好")) #%E4%BD%A0%E5%A5%BD


使用fiddler工具栏Tools下的TextWizard小工具进行字符串编码转换:




END





往期推荐





以上是关于HTTP协议压缩格式和URL编码介绍的主要内容,如果未能解决你的问题,请参考以下文章

HTTP协议格式详解

HTTP协议3之压缩--转

协议分析HTTP响应头中的2种编码方式介绍

深度解密HTTP通信细节

接口自动化之三 http协议

HTTP 传输内容的压缩