HTTP协议有关常识

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HTTP协议有关常识相关的知识,希望对你有一定的参考价值。


 

作者Georgekai

归档:学习笔记

2018/2/1

 


HTTP协议基础原理

1.1 面试题:简述用户访问网站的过程?

1. 利用DNS协议进程域名解析

2. 建立TCP协议三次握手过程

3. 客户端发出访问网站相应页面请求

  系统架构部署情况(可以说一说)

4. 服务端响应访问页面的请求信息

5. 断开TCP协议四次挥手过程

1.2 HTTP协议报文结构

1.2.1 请求报文结构:

查看请求和响应报文的结构:两种方法

curl www.baidu.com  -v  

wget --debug www.baidu.com  

 

 

1. 请求行:

1)请求的方法—get:客户端请求指定资源信息,服务器返回指定信息(没有请求主体)

         post:将客户端的数据提交到服务器(如:查询,注册)(有请求主体)

技术分享图片


2)请求的数据信息(默认请求index.html


3)请求http协议版本

    TCP协议分为长连接(http1.1)和短连接(http1.0

    可以看看http2.0版本特性


2. 请求头:客户信息 user-agent: 用户使用的浏览器/代理

      Hostwww.baidu.com  要访问的网站信息

      

3. 空行:表示请求头结束


4. 请求主体:get没有请求主体,post有请求主体

1.2.2 响应报文结构:

1. 起始行:

1HTTP协议版本信息

2)相应的状态码信息:  

技术分享图片

技术分享图片

技术分享图片

PSwww.jd.com以前的域名www.360buy.com


2. 响应头部:服务器有关信息

3. 空行:表示响应头结束

4. 响应主题内容:一般为htmlcssjs等代码信息

1.3 HTTP协议资源类型和名词概念介绍

1. 媒体资源类型

  对于web服务可以处理的用户请求资源信息(htmlxml

2. URL

  全称为Uniform Resource Location(统一资源定位符)

3. URI

  全称为Uniform Resource Identifier(统一资源标识符)

  channel.jd.com   /  women.html  nginx的识别方法

    url部分             uri部分

 

4. 静态网页资源

  静态资源特点:

   1. 纯文本类程序或文件,如.html、.htm、.xml、.shtml、.js、.css等;

      图片类文件或数据文档,如.jpg、.gif、.png、.bmp、.txt、.doc、.ppt等;

      视频类流媒体文件,如.mp4、.swf、.avi、.wmv、.flv等。

   2. 每个网页的内容都是保存在网站服务器文件系统上的,

      也就是说,静态网页是实实在在保存在服务器上的文件实体

   3. 网页内容是固定不变的,因此,容易被搜索引擎收录 (优点)

   4. 因为网页没有数据库的支持,所以在网站制作和维护方面的工作量较大,(缺点)

      当网站信息量很大时,完全依靠静态网页比较困难

   5. 网页的交互性较差,在程序的功能实现方面有较大的限制 (缺点)

   6. 网页程序在用户浏览器端解析

      当客户端向服务器请求数据时,服务器会直接从磁盘文件系统上返回数据(不做任何解析)  (优点)

 

应用场合:

技术分享图片

 

5. 动态网页资源(所谓的动态网页是与静态网页相对而言的)


  动态资源特点:

   1. 网页扩展名后缀常见为:.asp、.aspx、.php、.js、.do、.cgi等

      动态资源网页中会出现? &等特殊符号信息

   2. 网页一般以数据库技术为基础,大大降低了网站维护的工作量。

   3. 采用动态网页技术的网站可以实现更多的功能,

      如用户注册、用户登录、在线调查、投票、用户管理、订单处理、发博文等

   4. 动态网页并不是独立存在于服务器上的网页文件

   5. 动态网页资源不便于被搜索引擎收录

   6. 网页程序在服务架构端进行解析

 

应用场合:

技术分享图片 

 

6. 伪静态网页

取长补短(伪静态资源实质是动态资源)

集合了动态和静态的优点:便于搜索引擎查询, 可以处理动态代码,有数据库的支持


 

应用场合:

技术分享图片 

 

1.4 网站访问统计

1.4.1 网站流量度量语

1)IP

   IP(独立IP),即Internet Protocol,这里指独立IP数,

   独立IP数是指不同IP地址的计算机访问网站时被计的总次数

   一般一天内(00:00-24:00)相同IP地址(公网IP)的客户端访问网站页面只会被计一次

2)PV

   PV(访问量)即Page View,中文翻译为页面浏览

   即页面浏览量或点击量,不管客户端是不是相同,也不管IP是不是相同

   用户只要访问网站页面就会被计算PV,一次计一个PV。

3)UV

   UV(独立访客)即Unique Visitor,同一个客户端(PC或移动端)访问网站被计为一个访客。

   一天(00:00-24:00)内相同的客户端访问同一个网站只计一次UV。

   UV一般是以客户端Cookie等技术作为统计依据

1.4.2 cookiesession的区别:  

·cookie:根据用户信息,为用户设定一个身份标识信息,便于统计和识别用户信息(保存在客户端本地),  可以理解为钥匙

·session:记录用户信息,用户情况(保存在服务端本地),可以理解为锁头

1.4.3 网站访问统计方法

常用的统计工具:

· 网页信息统计软件-piwik

             pwiki统计工具:(https://piwik.org/)

             pwiki演示页面:https://piwik.org/demo

· ELK软件介绍说明

             http://blog.oldboyedu.com/elk/

 

1.4.4 并发连接概念

 A种理解:网站服务器每秒能够接收的最大用户请求数。

 B种理解:网站服务器每秒能够响应的最大用户请求数。

 C种理解:网站服务器在单位时间内能够处理的最大连接数。(目前我们支持第三种说法)

技术分享图片 

 

 

1.4.5 知名企业网站访问量参考

技术分享图片 

站访问量统计地址:http://alexa.chinaz.com/alexa_more.aspx



以上是关于HTTP协议有关常识的主要内容,如果未能解决你的问题,请参考以下文章

#WEB安全基础 : HTTP协议 | 0x2 HTTP有关协议通信

有关使用HTTP协议传输二进制文件

AJAX有关的请求协议

HTTP协议

Http协议简介

不惧面试:HTTP协议 - 基础扫盲