网络原理网络通信与协议

Posted bit me

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了网络原理网络通信与协议相关的知识,希望对你有一定的参考价值。

✨个人主页:bit me👇
✨当前专栏:Java EE初阶👇

目 录

一. 网络发展史

独立模式:计算机之间相互独立

网络互连

随着时代的发展,越来越需要计算机之间互相通信,共享软件和数据,即以多个计算机协同工作来完成业务,就有了网络互连。
 
网络互连:将多台计算机连接在一起,完成数据共享。
 
数据共享本质是网络数据传输,即计算机之间通过网络来传输数据,也称为网络通信。
 
根据网络互连的规模不同,可以划分为局域网和广域网。

局域网LAN

局域网,即 Local Area Network,简称LAN。
 
Local 即标识了局域网是本地,局部组建的一种私有网络。
 
局域网内的主机之间能方便的进行网络通信,又称为内网;局域网和局域网之间在没有连接的情况下,是无法通信的。

局域网组建网络的方式有很多种:

  1. 基于网线直连

  1. 基于交换机组建

  1. 基于交换机和路由器组建

  • 交换机:把多个机器连接到一个局域网中
  • 路由器:连接多个局域网
  1. 其实还有集线器,但是集线器比较特殊,它的功能非常有限,所以现在组网的时候很少看到了。

在交换机和路由器反复连接之下,就可以把很多很多的设备都连接在一起,使他们可以直接通信。当机器足够多的时候,就可以成为 " 广域网 "。广域网和局域网之间没有明确的界限。

广域网WAN

广域网,即 Wide Area Network,简称WAN。

通过路由器,将多个局域网连接起来,在物理上组成很大范围的网络,就形成了广域网。广域网内部的局域网都属于其子网。


二. 网络通信基础

网络互连的目的是进行网络通信,也即是网络数据传输,更具体一点,是网络主机中的不同进程间,基于网络传输数据。

那么,在组建的网络中,如何判断到底是从哪台主机,将数据传输到那台主机呢?这就需要使用IP地址来标识。

1. IP地址

IP地址主要用于标识网络主机、其他网络设备(如路由器)的网络地址。简单说,IP地址用于定位主机的网络地址。

就像我们发送快递一样,需要知道对方的收货地址,快递员才能将包裹送到目的地。

格式:

IP地址是一个32位的二进制数,通常被分割为4个“8位二进制数”(也就是4个字节),如:
01100100.00000100.00000101.00000110。

通常用“点分十进制”的方式来表示,即 a.b.c.d 的形式(a,b,c,d都是0~255之间的十进制整数)。如:100.4.5.6。

特殊IP:

127.*的IP地址用于本机环回(loop back)测试,通常是127.0.0.1
本机环回主要用于本机到本机的网络通信(系统内部为了性能,不会走网络的方式传输),对于
开发网络通信的程序(即网络编程)而言,常见的开发方式都是本机到本机的网络通信。

IP地址解决了网络通信时,定位网络主机的问题,但是还存在一个问题,传输到目的主机后,由哪个进程来接收这个数据呢?这就需要端口号来标识。

2. 端口号

概念:

在网络通信中,IP地址用于标识主机网络地址,端口号可以标识主机中发送数据、接收数据的进程。简单说:端口号用于定位主机中的进程。

类似发送快递时,不光需要指定收货地址(IP地址),还需要指定收货人(端口号)

格式:

端口号是0~65535范围的数字,在网络通信中,进程可以通过绑定一个端口号,来发送及接收网络数据。

注意事项:

两个不同的进程,不能绑定同一个端口号,但一个进程可以绑定多个端口号。

问题:

有了IP地址和端口号,可以定位到网络中唯一的一个进程,但还存在一个问题,网络通信是基于二进制0/1数据来传输,如何告诉对方发送的数据是什么样的呢?
 
网络通信传输的数据类型可能有多种:图片,视频,文本等。同一个类型的数据,格式可能也不同,如
发送一个文本字符串“你好!”:如何标识发送的数据是文本类型,及文本的编码格式呢?
 
基于网络数据传输,需要使用协议来规定双方的数据格式。

3. 认识协议(核心概念)

协议,网络协议的简称,网络协议是网络通信(即网络数据传输)经过的所有网络设备都必须共同遵从的一组约定、规则。如怎么样建立连接、怎么样互相识别等。只有遵守这个约定,计算机之间才能相互通信交流。

由三要素组成:

  1. 语法:即数据与控制信息的结构或格式;

类似打电话时,双方要使用同样的语言:普通话

  1. 语义:即需要发出何种控制信息,完成何种动作以及做出何种响应;

语义主要用来说明通信双方应当怎么做。用于协调与差错处理的控制信息。
类似打电话时,说话的内容。一方道:你瞅啥?另一方就得有对应的响应:瞅你咋的!

  1. 时序,即事件实现顺序的详细说明。

时序定义了何时进行通信,先讲什么,后讲什么,讲话的速度等。比如是采用同步传输还是
异步传输。
女生和男生的通话,总是由男生主动发起通话,而总是在男生恋恋不舍的时候,由女生要求
结束通话。

协议(protocol)最终体现为在网络上传输的数据包的格式。

为什么需要协议?

好比相亲,彼此协商胸口插支玫瑰花见面,这就是一种提前的约定,也可以称之为协议。

计算机之间的传输媒介是光信号和电信号。通过 “频率” 和 “强弱” 来表示 0 和 1 这样的信息。要想传递各种不同的信息,就需要约定好双方的数据格式。

  • 计算机生产厂商有很多;
  • 计算机操作系统,也有很多;
  • 计算机网络硬件设备,还是有很多;

 
如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来,约定一个
共同的标准,大家都来遵守,这就是 网络协议;

知名协议的默认端口

系统端口号范围为 0 ~ 65535,其中:0 ~ 1023 为知名端口号,这些端口预留给服务端程序绑定广泛使用的应用层协议,如:

  • 22端口:预留给SSH服务器绑定SSH协议
  • 21端口:预留给FTP服务器绑定FTP协议
  • 23端口:预留给Telnet服务器绑定Telnet协议
  • 80端口:预留给HTTP服务器绑定HTTP协议
  • 443端口:预留给HTTPS服务器绑定HTTPS协议

需要补充的是:

以上只是说明 0 ~ 1023 范围的知名端口号用于绑定知名协议,但某个服务器也可以使用其他 1024 ~ 65535 范围内的端口来绑定知名协议。

餐厅的VIP包房是给会员使用,但会员也可以不坐包房,坐其他普通座位。

4. 五元组

在TCP/IP协议中,用五元组来标识一个网络通信:

  1. 源IP:标识源主机
  2. 源端口号:标识源主机中该次通信发送数据的进程
  3. 目的IP:标识目的主机
  4. 目的端口号:标识目的主机中该次通信接收数据的进程
  5. 协议号:标识发送进程和接收进程双方约定的数据格式

用发送快递来讲就是:

  1. 源IP:寄件人地址
  2. 源端口号:寄件人
  3. 目的IP:收件人地址
  4. 目的端口号:收件人
  5. 协议:顺丰快递

5. 协议分层

网络通信,是一个非常复杂的过程,有很多的问题,很多的细节要处理,如果就用一个协议,把所有的问题都解决,就会造成这个协议复杂无比。

于是在这里就有了协议拆分,把协议拆分成多个协议,但是在后续的发展中发现拆分出来的协议解决的问题差不多,因此就再把这些协议分成很多类,就是协议分层。(每一层里都有很多协议,这些协议做的工作都差不多)

当前我们看到的网络结构就是协议分层之后的产物。

网络协议拆分,并分层之后,有啥好处呢?
 

  1. 下层协议给上层提供服务,上层调用下层协议。(封装)
     
    实现上层协议的人,不必考虑下层协议的细节
  2. 解耦合:可以把同一层协议替换成其他协议,对于其他层次的协议来说,基本是无感知的
     
    类似于打电话我们只需要有语言协议即可,并不需要了解电话协议,也互不影响

当前有两种分层方式:

  1. OSI七层网络模型(理论上存在,实际上没有这么实现的)
  2. TCP/IP五层(或四层)模型

OSI七层网络模型:


TCP/IP五层(或四层)模型:

上面三层统称为应用层

  • 应用层:负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等。我们的网络编程主要就是针对应用层。(数据传输过去之后,具体怎么使用)
  • 传输层:负责两台主机之间的数据传输。如传输控制协议 (TCP),能够确保数据可靠的从源主机发送到目标主机。(两个点之间的通信,不考虑路径规划)
  • 网络层:负责地址管理和路由选择。例如在IP协议中,通过IP地址来标识一台主机,并通过路由表的方式规划出两台主机之间的数据传输的线路(路由)。路由器(Router)工作在网路层。(两个点之间的路径规划)
  • 数据链路层:负责设备之间的数据帧的传送和识别。例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作。有以太网、令牌环网,无线LAN等标准。交换机(Switch)工作在数据链路层。(两个相邻节点之间如何传输)
  • 物理层:负责光/电信号的传递方式。比如现在以太网通用的网线(双绞 线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤,现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等。集线器(Hub)工作在物理层。(网络通行基础)

只有应用层是程序可以写代码处理的,其他的都是由操作系统和硬件设备来处理的

网络编程的主要工作就是写应用层代码,来处理应用层的协议数据

物理层我们考虑的比较少。因此很多时候也可以称为 TCP/IP四层模型。

网络设备所在分层

  • 对于一台主机,它的操作系统内核实现了从传输层到物理层的内容,也即是TCP/IP五层模型的下四层;
  • 对于一台路由器,它实现了从网络层到物理层,也即是TCP/IP五层模型的下三层;
  • 对于一台交换机,它实现了从数据链路层到物理层,也即是TCP/IP五层模型的下两层;
  • 对于集线器,它只实现了物理层;

注意我们这里说的是传统意义上的交换机和路由器,也称为二层交换机(工作在TCP/IP五层模型的下两层)、三层路由器(工作在TCP/IP五层模型的下三层)。

面试拓展:

交换机和路由器功能都是用来组建局域网
 
交换机是工作在数据链路层;路由器是工作在网络层;

实际上路由器和交换机都越来越强大,彼此之间有许多功能的重叠

6. 封装和分用

封装描述了网络是如何传输数据的

例如我们使用 QQ 传输消息,主机 A 发送消息

  1. 应用层,QQ 应用程序,把用户输入的数据整理成应用层数据报(相当类似于 “字符串拼接” 的方式,构成更完整,信息更多的数据,再传输)

    接下来就需要把这个报交给传输层(操作系统内核)

  2. 传输层,会根据当前使用的传输层协议,给应用层数据报进行进一步组装

    继续把这个数据报交给网络层

  3. 网络层,主要使用的是 IP 协议,再进行进一步组装

    数据组合好了之后,再交给数据链路层

  4. 数据链路层,比如使用以太网协议,再进一步组装

    构造成了一个以太网数据帧,再把这个数据交给了物理层

  5. 物理层,拿到数据之后,把这里的这些二进制序列,转换成 光信号/电信号,把光电信号发送出去即可

上述从上到下依次添加报头的过程,就称为封装

当主机 B 收到上述数据的时候,就是封装的 “逆过程” ,称为 “分用”,每一层协议把对应的协议报头给解析出来,并且去掉报头。

  1. 物理层,把光电信号转换回二进制的数据,得到以太网数据帧,交给数据链路层

  2. 数据链路层,去掉帧头帧尾,把载荷部分取出来,交给网络层

  3. 网络层,IP 协议解析出 IP 报头,并去掉,把载荷取出来,交给传输层

  4. 传输层,UDP 协议再进行解析,解析出 UDP 报头,把载荷取出来,交给应用程序

  5. 应用层,qq这个程序,qq再解析这里的信息,显示到界面上

上述过程中也就体现出网络通信中各个协议是如何配合工作的

封装分用不仅仅出现在主机上,也出现在传输过程中,包括在交换机和路由器上。

  • 经典路由器,是封装分用到网络层
  • 经典交换机,是封装分用到数据链路层

云计算--网络原理与应用--20171115

  • IP 协议
  • ARP协议
  • TCP/UDP协议
  • 网络传输介质

一 IP协议

网络层负责定义数据通过网络流动所经过的路径。主要功能如下:

  • 定义基于IP协议的逻辑地址(IP地址)
  • 选择数据通过网络的最佳路径
  • 连接不同的媒介类型

IP数据包格式:

  

关键字:

  • 版本:IP的版本号
  • 优先级与服务类型(TOS):表示数据包的优先级和服务类型,实现QoS的要求
  • TTL:time to live。表示IP包哦生存周期,防止数据包在网络中无限循环。最大循环次数255.
  1. TTL值意义是数据包在被抛弃前在网路中可以经历的最大周转次数。数据包每经过一个路由器会检查一次该值,当为0时,数据包就被抛弃。
  2. 一个数据包每经过一个路由器,TTL值减1.
  • 协议号(8):协议字段,表示数据字上层由哪个协议封装,TCP协议号为6,UDP协议号为17
  • 源地址(source IP address)和目的地址(destination ip address)各32位

 

ARP协议(address resolution protocol)地址解析协议

在局域网中将一个已知的IP地址解析成MAC地址,以便在交换机上通过MAC地址进行通信。

1.实现过程:

  1. PC1想发送数据给PC2,先检查自己的ARP缓存表。在ARP缓存表中一条IP地址对应一条MAC地址。如果在缓存表中没有PC2的IP地址和MAC地址,则发送ARP请求;
  2. PC1发送局域网发送ARP请求信息,请求的目的地址为MAC广播地址(FF-FF-FF-FF-FF-FF),请求内容为“who has PC2 ip 地址
  3. 其余机器收到该广播消息后自动丢弃,当PC2收到后添加PCI的ip地址和MAC信息到PC2的ARP缓存表,并发送ARP应答,告诉PC1自己的MAC地址(单播)
  4. PC1收到ARP应答后添加PC2的ip地址和MAC地址到ARP缓存表中.

2. 本地ping 百度 ARP请求和应答消息如下:

 

 

二  TCP和协议

  TCP是面向连接的,可靠的进程到进程通信的协议。它在源点和终点设置一条虚连接。

  • 1.TCP报文段(segment)的首部格式如下:

  •  源端口号:发送端
  • 目的端口号:接受端
  • 序号:报文段的序号,不一定从0开始,双方序号是独立的;
  • 确认号:对发送端发送确认信息,表示之前的数据段都已经收到;
  • 控制位: 
  1. ACK:确认信息
  2. syn:同步序列号,建立连接时设置为1;
  3. FIN:断开连接时设置为1;

 

TCP 建立时的三次握手:

  

 

TCP断开连接的四次握手:

 

常用的TCP端口

21   ftp  

23   telnet        用于远程登录

25  smtp          用于邮件

80  http            超文本传输协议

110   pop3        邮件

 

常用的UDP端口

69  tfitp  简单文件传输协议

111  rpc  远程过程调用

123  ntp  网络时间协议

 

三  网络传输介质

 1.常用光纤接口:sc 大方头;LC 小方头; FC圆头

2. 双绞线连接规范

T568A:白绿 绿 白橙 蓝 白蓝 橙 白棕 棕

T568B:白橙 橙 白绿 蓝 白蓝 绿 白棕 棕

口诀:相同设备用交叉线,不同设备用直通线,PC路由是相同设备。

以上是关于网络原理网络通信与协议的主要内容,如果未能解决你的问题,请参考以下文章

java网络通信:HTTP协议 之 Sessions与Cookies

java-es理论

云计算--网络原理与应用--20171115

[架构之路-41]:目标系统 - 系统软件 - Linux下的网络通信-1-计算机网络拓扑架构ISO协议栈以太网协议栈与工作原理

[架构之路-41]:目标系统 - 系统软件 - Linux下的网络通信-1-计算机网络拓扑架构ISO协议栈以太网协议栈与工作原理

Android网络编程HTTP协议原理