Linux网络编程(协议解析)

Posted AllenSquirrel

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux网络编程(协议解析)相关的知识,希望对你有一定的参考价值。

协议解析

  • 协议基础

自定制协议:程序员自己定制的协议

应用层协议:如何将多个数据对象组织成为一个二进制数据串进行传输

需要考虑传输性能和解析性能,解析性能高的不一定传输性能高

比如:struct {int num1,int num2,char op}  解析方便  但由于占用内存大导致传输性能较低

  • 序列化

序列化:将多个数据对象按照指定协议进行组织实现持久化存储或者网络通信传输的二进制数据串的过程

反序列化:按照指定协议将二进制数据串解析得到各个数据对象的过程

典型序列化方式:结构体序列化,json序列化,protobuf序列化

  • HTTP协议

http协议:超文本传输协议,明文字符串传输协议

https协议:加密之后的http协议,安全性更高

http协议在传输层基于tcp协议实现,是一个简单的请求-响应协议

http协议格式(也称为:http协议数据结构)

  • 首行:请求行  响应行(对于请求和响应的简单关键描述)

请求行:请求方法   URL   协议版本\\r\\n

(1)请求方法:

  1. GET:向服务器获取实体资源(包含正文),也可以提交数据但由于提交过程中没有正文所以提交数据没有在正文而在URL中   注意:(1)get提交数据在url中,不安全    (2)url长度有限制导致提交数据有限制
  2. HEAD:向服务器仅获取响应头部,不要正文实体
  3. POST:向服务器提交数据,提交有正文,提交数据放在正文中
  4. 1PUT从客户端向服务器传送的数据取代指定的文档的内容。
    2DELETE请求服务器删除指定的页面。
    3CONNECTHTTP/1.1 协议中预留给能够将连接改为管道方式的代理服务器。
    4OPTIONS允许客户端查看服务器的性能。
    5TRACE回显服务器收到的请求,主要用于测试或诊断。
    6PATCH是对 PUT 方法的补充,用来对已知资源进行局部更新 。

(2)URL:(网址)统一资源定位符,用于定位网络中某个主机上的资源 

组成:协议名称://用户名:密码@域名:端口/资源路径?查询字符串数据#片段标识符

  • http服务默认使用80端口    https服务默认使用443端口
  • 查询字符串:提交给服务器的数据,由一个个key=value键值对组成,键值对之间以&符号间隔
  • urlencode:编码   目的:用户请求的资源路径或查询字符串中存在特殊字符,可能与url特殊字符冲突

编码方法:将特殊字符每个字节(8bit)转换为16进制数字字符,并前缀%     eg: '+'  %2B

  • urldecode:解码

解码方法:遇到%,则认为紧随其后的两个字符进行解码,将两个字符转换为数字(16进制转10进制)

片段标识符:定位网页位置

(3)协议版本

0.9:最早期版本,只支持GET方法,支持超文本数据传输,没有规范http协议格式

1.0:规范了http协议格式,新增支持GET,HEAD,POST请求方法。支持各种多媒体资源传输,简单缓冲控制

1.1:支持更多请求方法,对1.0进行性能提升,支持长连接(connection:keep-alive)

2.0:重新定义http协议       1,二进制数据传输   2,支持主动推送资源   3,服务器长连接响应,不需要按序进行,解决队头阻塞问题

 

响应行:协议版本   响应状态码   状态码描述

响应状态码:直观向客户端反映处理结果

HTTP状态码分类
分类分类描述
1**一些描述信息,服务器收到请求,需要请求者继续执行操作
2**成功,操作被成功接收并正确处理
3**重定向,需要进一步的操作以完成请求,表示本次请求的资源移到新的链接处,原链接依然可用
4**客户端错误,请求包含语法错误或无法完成请求
5**服务器错误,服务器在处理请求的过程中发生了错误
状态码状态码描述中文描述
100Continue继续。客户端应继续其请求
101Switching Protocols切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到HTTP的新版本协议
 
200OK请求成功。一般用于GET与POST请求
201Created已创建。成功请求并创建了新的资源
202Accepted已接受。已经接受请求,但未处理完成
203Non-Authoritative Information非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本
204No Content无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,可确保浏览器继续显示当前文档
205Reset Content重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。可通过此返回码清除浏览器的表单域
206Partial Content部分内容。服务器成功处理了部分GET请求,eg:断点续传
 
300Multiple Choices多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择
301Moved Permanently永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替
302Found临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI
303See Other查看其它地址。与301类似。使用GET和POST请求查看
304Not Modified未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源
305Use Proxy使用代理。所请求的资源必须通过代理访问
306Unused已经被废弃的HTTP状态码
307Temporary Redirect临时重定向。与302类似。使用GET请求重定向
 
400Bad Request客户端请求的语法错误,服务器无法理解
401Unauthorized请求要求用户的身份认证
402Payment Required保留,将来使用
403Forbidden服务器理解请求客户端的请求,但是拒绝执行此请求
404Not Found服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面
405Method Not Allowed客户端请求中的方法被禁止
406Not Acceptable服务器无法根据客户端请求的内容特性完成请求
407Proxy Authentication Required请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权
408Request Time-out服务器等待客户端发送的请求时间过长,超时
409Conflict服务器完成客户端的 PUT 请求时可能返回此代码,服务器处理请求时发生了冲突
410Gone客户端请求的资源已经不存在。410不同于404,如果资源以前有现在被永久删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置
411Length Required服务器无法处理客户端发送的不带Content-Length的请求信息
412Precondition Failed客户端请求信息的先决条件错误
413Request Entity Too Large由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息
414Request-URI Too Large请求的URI过长(URI通常为网址),服务器无法处理
415Unsupported Media Type服务器无法处理请求附带的媒体格式
416Requested range not satisfiable客户端请求的范围无效
417Expectation Failed服务器无法满足Expect的请求头信息
 
500Internal Server Error服务器内部错误,无法完成请求
501Not Implemented服务器不支持请求的功能,无法完成请求
502Bad Gateway作为网关或者代理工作的服务器尝试执行请求时,从远程服务器接收到了一个无效的响应,连接建立失败
503Service Unavailable由于超载或系统维护,服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的Retry-After头信息中
504Gateway Time-out充当网关或代理的服务器,未及时从远端服务器获取请求,响应延迟
505HTTP Version not supported服务器不支持请求的HTTP协议的版本,无法完成处理
  • 头部:对于请求或响应或正文的一些关键描述(由一个个key:value键值对组成,每个键值对以\\r\\n结尾)

典型头部字段:

Connection长短连接控制keep-alive/close
Referer记录本次请求的来源连接 
Content-Type表示正文数据格式 
Content-Length表示正文数据长度解决粘包问题
cookie /session请求头cookie  响应头session 

 cookie:

一个客户端登录之后,服务端验证登录,成功后,通过set-cookie设置cookie信息返回给客户端 

 客户端接收到响应后,将set-cookie字段的cookie信息保存起来,下次请求服务器直接从cookie文件中读取出cookie信息,通过cookie字段发送给服务器

cookie是一个维护http通信状态的技术,但存在安全隐患

解决方法:session

服务端针对每个客户端建立会话当客户端登录成功后,创建会话,在会话中记录客户端用户信息及状态等信息  通过set-cookie字段将session-id返回给客户端session-id每次请求都会发生变化,并且用户的隐私信息一直保存在服务器中,防止泄露

cookie和session区别:

cookie是维护http通信状态的技术,将关键信息保存在客户端,每次请求服务器时,读取出来发送给服务端,此过程中将关键信息保存在cookie字段中进行传输

session是解决cookie安全隐患,将关键信息保存在服务端,通过创建会话后,而只将session-id返回给客户端,客户端作为cookie字段保存,再次请求过程中只是将session-id信息保存在cookie字段中进行传输,而非直接传输用户信息,安全性相比较于cookie提高

  • 空行:\\r\\n  间隔头部与正文

  • 正文:客户端提交给服务端,或者服务端响应给客户端的数据

 

简单的http服务器的搭建:


1.搭建tcp服务端
⒉获取新建连接
3.使用新建连接,等待接收数据(http协议的请求数据)
4.接收过程:先接收http头部,解析头部-Content-Length确定正文长度5.接收指定长度的正文
6.根据请求方法以及资源路径确定客户端的请求目的7.进行具体对应的业务处理
8.组织http协议格式的响应数据,对客户端进行回复
9.如果是短连接,则直接关闭套接字,如果是长连接,则继续等待接收数据

代码如下:

运行结果如下:

抓包结果如下:

以上是关于Linux网络编程(协议解析)的主要内容,如果未能解决你的问题,请参考以下文章

linux网络协议栈源码分析 - 链路层ARP地址解析协议

Linux网络编程中网络传输KCP协议原理解析

linux高性能编程学习笔记

如何在Linux下禁用ARP协议

linux网络配置和域名解析

TCP协议疑难杂症全景解析