访问一个网页的全过程

Posted tangkaishou

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了访问一个网页的全过程相关的知识,希望对你有一定的参考价值。

引言

打开浏览器,在地址栏输入URL,回车,出现网页内容。整个过程发生了什么?其中的原理是什么?以下进行整理和总结。

 

整个过程可以概括为几下几个部分:

1.域名解析成IP地址;

2.与目的主机进行TCP连接(三次握手);

3.发送与收取数据(浏览器与目的主机开始HTTP访问过程);

4.与目的主机断开TCP连接(四次挥手);

 

下面详细介绍其中的原理

1. 域名解析成IP地址

访问目标地址有两种方式:

①使用目标IP地址访问。由于IP地址是一堆数字不方便记忆,于是有了域名这种字符型标识。

 

②使用域名访问。域名解析就是域名到IP地址的转换过程,域名的解析工作由DNS服务器完成。

 

DNS域名解析时用的是UDP协议。整个域名解析的过程如下:

  1. 浏览器向本机DNS模块发出DNS请求,DNS模块生成相关的DNS报文;
  2. DNS模块将生成的DNS报文传递给传输层的UDP协议单元;
  3. UDP协议单元将该数据封装成UDP数据报,传递给网络层的IP协议单元;
  4. IP协议单元将该数据封装成IP数据包,其目的IP地址为DNS服务器的IP地址;
  5. 封装好的IP数据包将传递给数据链路层的协议单元进行发送;
  6. 发送时在ARP缓存中查询相关数据,如果没有,就发送ARP广播(包含待查询的IP地址,收到广播的主机检查自己的IP,符合条件的主机将含有自己MAC地址的ARP包发送给ARP广播的主机)请求,等待ARP回应;
  7. 得到ARP回应后,将IP地址与路由的下一跳MAC地址对应的信息写入ARP缓存表;
  8. 写入缓存后,以路由下一跳的地址填充目的MAC地址,以数据帧形式转发;
  9. 转发可能进行多次;

 

DNS请求到达DNS服务器的数据链路层协议单元;

DNS服务器的数据链路层协议单元解析数据帧,将内部的IP数据包传递给网络层IP协议单元;

DNS服务器的IP协议单元解析IP数据包,将内部的UDP数据报传递给传输层UDP协议单元;

DNS服务器的UDP协议单元解析收到的UDP数据报,将内部的DNS报文传递给DNS服务单元;

DNS服务单元将域名解析成对应IP地址,产生DNS回应报文;

DNS回应报文->UDP->IP->MAC->我的主机;

我的主机收到数据帧,将数据帧->IP->UDP->浏览器;

将域名解析结果以域名和IP地址对应的形式写入DNS缓存表。

 

与目的主机进行TCP连接(三次握手)

向目的主机发送TCP连接请求报文;

该TCP报文中SYN标志位设为1,表示连接请求;

该TCP报文通过IP(DNS)->MAC(ARP)->网关->目的主机;

目的主机收到数据帧,通过IP->TCP,TCP协议单元回应请求应答报文;

该报文中SYN和ACK标志设为1,表示连接请求应答;

该TCP报文通过IP(DNS)->MAC(ARP)->网关->我的主机;

我的主机收到数据帧,通过IP->TCP,TCP协议单元回应请求确认报文;

该TCP报文通过IP(DNS)->MAC(ARP)->网关->目的主机;

目的主机收到数据帧,通过IP->TCP,连接建立完成。

技术分享图片

发送与收取数据(浏览器与目的主机开始HTTP访问过程)

浏览器向域名发出GET方法报文(HTTP请求);

该GET方法报文通过TCP->IP(DNS)->MAC(ARP)->网关->目的主机;

目的主机收到数据帧,通过IP->TCP->HTTP,HTTP协议单元会回应HTTP协议格式封装好的html形式数据(HTTP响应);[ 从请求信息中获得客户机想访问的主机名。从请求信息中获取客户机想要访问的web应用(web应用程序指提供浏览器访问的程序,简称web应用)。从请求信息中获取客户机要访问的web资源。(web资源,即各种文件,图片,视频,文本等)读取相应的主机下的web应用,web资源。用读取到的web资源数据,创建一个HTTP响应。]

 

该HTML数据通过TCP->IP(DNS)->MAC(ARP)->网关->我的主机;

我的主机收到数据帧,通过IP->TCP->HTTP->浏览器,浏览器以网页形式显示HTML内容。

与目的主机断开TCP连接(四次挥手)

TCP连接释放过程

浏览器向目的主机发出TCP连接结束请求报文,此时进入FIN WAIT状态;

该报文FIN标志位设为1,表示结束请求【第一次】;

TCP结束请求报文通过IP(DNS)->MAC(ARP)->网关->目的主机;

目的主机收到数据帧,通过IP->TCP,TCP协议单元回应结束应答报文【第二次】;

当前只是进行回应,因为目的主机可能还有数据要传,并不急着断开连接;

该报文中ACK标志位设为1,表示收到结束请求;

目的数据发送完所有数据后,向我的主机发出TCP连接结束请求报文【第三次】;

该报文FIN标志位设为1,表示结束请求;

TCP结束请求报文通过IP(DNS)->MAC(ARP)->网关->我的主机;

我的主机收到数据帧,通过IP->TCP,TCP协议单元回应结束应答报文,此时进入TIME WAIT状态,因为不相信网络是可靠的,如果目的主机没收到还可以重发;

该报文中的FIN标志位均设为1,表示结束应答;

该TCP回应报文通过IP(DNS)->MAC(ARP)->网关->目的主机【第四次】;

目的主机关闭连接;

TIME WAIT等待结束后,没有收到回复,说明目的正常关闭了,我的主机也关闭连接。

总结:

URL访问网站时的网络传输全过程,可以归纳为:

首先通过域名找到IP,如果缓存里没有就要请求DNS服务器;得到IP后开始与目的主机进行三次握手来建立TCP连接;连接建立后进行HTTP访问,传输并获取网页内容;传输完后与目的主机四次挥手来断开TCP连接。

 

以上是关于访问一个网页的全过程的主要内容,如果未能解决你的问题,请参考以下文章

简单讲讲访问一个网页的过程

浏览器访问网页的详细内部过程

网页完成一次请求全过程

浏览器访问网页内部详细过程

浏览器采用http 协议访问网页的工作过程

什么库可以模拟客户端请求网页访问过程