Python学习day3--网络基础之网络协议篇

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python学习day3--网络基础之网络协议篇相关的知识,希望对你有一定的参考价值。

一、互联网协议

连接两台计算机之间的Internet实际上就是一系列统一的标准,这些标准称之为互联网协议,互联网的本质就是一系列网络协议。

二 、为什么要有互联网协议

互联网协议就相当于计算机界的英语。它的功能:定义计算机如何接入internet,以及接入internet的计算机通信的标准。

三、tcp/ip五层模型

互联网协议按照功能不同分为osi七层或tcp/ip五层或tcp/ip四层,这里仅讨论五层模型。

技术分享

用户感知的是最上面的应用层,越往下越靠近硬件,每一层都有自己运行的特定协议。

物理层:传递电信号

数据链路层:定义电信号的分组方式,Ethernet,mac,广播的工作方式

  • 以太网协议ethernet规定:
    • 一组电信号构成一个数据包,叫做‘帧’
    • 每一数据帧分成:报头head和数据data两部分 

      head包含:(固定18个字节)

      • 发送者/源地址,6个字节
      • 接收者/目标地址,6个字节
      • 数据类型,6个字节

      data包含:(最短46字节,最长1500字节)

      • 数据包的具体内容

      head长度+data长度=最短64字节,最长1518字节,超过最大限制就分片发送

  • mac地址: ethernet规定接入internet的设备都必须具备网卡,发送端和接收端的地址便是指网卡的地址,即mac地址。

                       每块网卡出厂时都被烧制上一个世界唯一的mac地址,长度为48位2进制,通常由12位16进制数表示(前六位是厂商编号,后六位是流水线号)

  • 广播:有了mac地址,同一网络内的两台主机就可以通信了(一台主机通过arp协议获取另外一台主机的mac地址)

                 ethernet采用最原始的方式,广播的方式进行通信,即计算机通信基本靠吼

网络层:IP,标识一个子网

           同一网络区域内的计算机通信靠广播,否则通过路由的方式,此时我们遇到的问题就是怎么区分哪些计算机是属于同一广播域的,即网络层功能:引入一套新的地址用来区  分不同的广播域/子网,这套地址即网络地址
  • 规定网络地址的协议叫ip协议,它定义的地址称之为ip地址,一个ip地址通常写成四段十进制数。IP协议的作用主要有两个,一个是为每一台计算机分配IP地址,另一个是确定哪些地址在同一个子网络。
  • ip地址分成两部分

    • 网络部分:标识子网
    • 主机部分:标识主机

         单纯的ip地址段只是标识了ip地址的种类,从网络部分或主机部分都无法辨识一个ip所处的子网

  • 子网掩码:表示子网络特征的一个参数。形式上等同于IP地址,也是一个32位二进制数字,它的网络部分全部为1,主机部分全部为0。

        将两个IP地址与子网掩码分别进行AND运算(两个数位都为1,运算结果为1,否则为0),然后比较结果是否相同,如果是的话,就表明它们在同一个子网络中,否则就不是。

  • ip数据包:分为head和data部分,无须为ip包定义单独的栏位,直接放入以太网包的data部分

                      以太网数据包的”数据”部分,最长只有1500字节。如果IP数据包超过了1500字节,它就需要分割成几个以太网数据包,分开发送了。

  • ARP协议:计算机在发包时,获取自身的mac是容易的,如何获取目标主机的mac,就需要通过arp协议。

                      arp协议功能:广播的方式发送数据包,获取目标主机的mac地址

                      协议工作方式:每台主机ip都是已知的。例如:主机172.16.10.10/24访问172.16.10.11/24。首先通过ip地址和子网掩码区分出自己所处的子网,分析 172.16.10.10/24与172.16.10.11/24是否处于同一网络,是同一网络,通过ARP获取的是目标主机mac,目标主机ip;如果不是同一网络,那么通过ARP获取的是网关的mac,目标主机ip。这个包会以广播的方式在发送端所处的自网内传输,所有主机接收后拆开包,发现目标ip为自己的,就响应,返回自己的mac。

                      所有上层的包到最后都要封装上以太网头,然后通过以太网协议发送

传输层:tcp/udp==》基于端口工作的协议,标识一台机器的唯一应用程序

  • 传输层功能:建立端口到端口的通信

                         端口范围0-65535,0-1023为系统占用端口

              tcp协议:可靠传输

              udp协议:不可靠传输

  • tcp三次握手和四次挥手:建立连接三次完成,断开连接需要四次完成

技术分享

应用层:http,用户自己定义的协议

  • 应用层功能:规定应用程序的数据格式。

                         发送数据是一个封装的过程,接收数据则是解封装。

四、用户上网流程

1.本机获取

  • 本机的IP地址:192.168.1.100
  • 子网掩码:255.255.255.0
  • 网关的IP地址:192.168.1.1
  • DNS的IP地址:8.8.8.8

2.打开浏览器,想要访问Google,在地址栏输入了网址:www.google.com。

3.dns协议(基于udp协议)

技术分享

 

  • 13台根dns

4.HTTP部分的内容

     我们假定这个部分的长度为4960字节,它会被嵌在TCP数据包之中。

5 TCP协议

  • TCP数据包需要设置端口,接收方(Google)的HTTP端口默认是80,发送方(本机)的端口是一个随机生成的1024-65535之间的整数,假定为51775。
  • TCP数据包的标头长度为20字节,加上嵌入HTTP的数据包,总长度变为4980字节。

6 IP协议

  • 然后,TCP数据包再嵌入IP数据包。IP数据包需要设置双方的IP地址,这是已知的,发送方是192.168.1.100(本机),接收方是172.194.72.105(Google)。
  • IP数据包的标头长度为20字节,加上嵌入的TCP数据包,总长度变为5000字节。

7 以太网协议

  • 最后,IP数据包嵌入以太网数据包。以太网数据包需要设置双方的MAC地址,发送方为本机的网卡MAC地址,接收方为网关192.168.1.1的MAC地址(通过ARP协议得到)。
  • 以太网数据包的数据部分,最大长度为1500字节,而现在的IP数据包长度为5000字节。因此,IP数据包必须分割成四个包。因为每个包都有自己的IP标头(20字节),所以四个包的IP数据包的长度分别为1500、1500、1500、560。

8 服务器端响应

  • 经过多个网关的转发,Google的服务器172.194.72.105,收到了这四个以太网数据包。
  • 根据IP标头的序号,Google将四个包拼起来,取出完整的TCP数据包,然后读出里面的”HTTP请求”,接着做出”HTTP响应”,再用TCP协议发回来。
  • 本机收到HTTP响应以后,就可以将网页显示出来,完成一次网络通信。

五、其他

  • IP层的ip地址可以唯一标示主机,而TCP层协议和端口号可以唯一标示主机的一个进程,这样我们可以利用ip地址+协议+端口号唯一标示网络中的一个进程。
  • DHCP:DHCP(Dynamic Host Configuration Protocol,动态主机配置协议)是一个局域网的网络协议,使用UDP协议工作, 主要有两个用途:给内部网络或网络服务供应商自动分配IP地址,给用户或者内部网络管理员作为对所有计算机作中央管理的手段。DHCP有3个端口,其中UDP67和UDP68为正常的DHCP服务端口,分别作为DHCP Server和DHCP Client的服务端口;还有一个546号端口。
  • DNS:DNS(Domain Name System,域名系统),因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的IP数串。通过主机名,最终得到该主机名对应的IP地址的过程叫做域名解析(或主机名解析)。DNS协议运行在UDP协议之上,使用端口号53。有递归和迭代查询两种方式。
  • 域名定义:主机 二级域名 顶级域名  根域     

以上是关于Python学习day3--网络基础之网络协议篇的主要内容,如果未能解决你的问题,请参考以下文章

python全栈学习笔记网络基础之网络协议篇

day3 网络基础

软工网络15团队作业4——Alpha阶段敏捷冲刺之Scrum 冲刺博客(Day3)

爬虫学习 06.Python网络爬虫之requests模块

DAY3 python基础之数据类型总览

爬虫学习推荐目录