Java 如何 解析二进制协议?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java 如何 解析二进制协议?相关的知识,希望对你有一定的参考价值。
参考技术A Java是由Sun Microsystems公司于1995年5月推出的Java程序设计语言(以下简称Java语言)和Java平台的总称。用Java实现的HotJava浏览器(支持Java applet)显示了Java的魅力:跨平台、动态的Web、Internet计算。从此,Java被广泛接受并推动了Web的迅速发展,常用的浏览器现在均支持Java applet。另一方面,Java技术也不断更新。Java平台由Java虚拟机(Java Virtual Machine)和Java 应用编程接口(Application Programming Interface、简称API)构成。Java 应用编程接口为Java应用提供了一个独立于操作系统的标准接口,可分为基本部分和扩展部分。在硬件或操作系统平台上安装一个Java平台之后,Java应用程序就可运行。现在Java平台已经嵌入了几乎所有的操作系统。这样Java程序可以只编译一次,就可以在各种系统中运行。Java应用编程接口已经从1.1x版发展到1.2版。目前常用的Java平台基于Java1.4,最近版本为Java1.7。
Java分为三个体系JavaSE(Java2 Platform Standard Edition,java平台标准版),JavaEE(Java 2 Platform,Enterprise Edition,java平台企业版),JavaME(Java 2 Platform Micro Edition,java平台微型版)。
2009年04月20日,oracle(甲骨文)宣布收购sun。
Linux网络编程(协议解析)
协议解析
-
协议基础
自定制协议:程序员自己定制的协议
应用层协议:如何将多个数据对象组织成为一个二进制数据串进行传输
需要考虑传输性能和解析性能,解析性能高的不一定传输性能高
比如:struct {int num1,int num2,char op} 解析方便 但由于占用内存大导致传输性能较低
-
序列化
序列化:将多个数据对象按照指定协议进行组织实现持久化存储或者网络通信传输的二进制数据串的过程
反序列化:按照指定协议将二进制数据串解析得到各个数据对象的过程
典型序列化方式:结构体序列化,json序列化,protobuf序列化
-
HTTP协议
http协议:超文本传输协议,明文字符串传输协议
https协议:加密之后的http协议,安全性更高
http协议在传输层基于tcp协议实现,是一个简单的请求-响应协议
http协议格式(也称为:http协议数据结构)
-
首行:请求行 响应行(对于请求和响应的简单关键描述)
请求行:请求方法 URL 协议版本\\r\\n
(1)请求方法:
- GET:向服务器获取实体资源(包含正文),也可以提交数据但由于提交过程中没有正文所以提交数据没有在正文而在URL中 注意:(1)get提交数据在url中,不安全 (2)url长度有限制导致提交数据有限制
- HEAD:向服务器仅获取响应头部,不要正文实体
- POST:向服务器提交数据,提交有正文,提交数据放在正文中
-
1 PUT 从客户端向服务器传送的数据取代指定的文档的内容。 2 DELETE 请求服务器删除指定的页面。 3 CONNECT HTTP/1.1 协议中预留给能够将连接改为管道方式的代理服务器。 4 OPTIONS 允许客户端查看服务器的性能。 5 TRACE 回显服务器收到的请求,主要用于测试或诊断。 6 PATCH 是对 PUT 方法的补充,用来对已知资源进行局部更新 。
(2)URL:(网址)统一资源定位符,用于定位网络中某个主机上的资源
组成:协议名称://用户名:密码@域名:端口/资源路径?查询字符串数据#片段标识符
- http服务默认使用80端口 https服务默认使用443端口
- 查询字符串:提交给服务器的数据,由一个个key=value键值对组成,键值对之间以&符号间隔
- urlencode:编码 目的:用户请求的资源路径或查询字符串中存在特殊字符,可能与url特殊字符冲突
编码方法:将特殊字符每个字节(8bit)转换为16进制数字字符,并前缀% eg: '+' %2B
- urldecode:解码
解码方法:遇到%,则认为紧随其后的两个字符进行解码,将两个字符转换为数字(16进制转10进制)
片段标识符:定位网页位置
(3)协议版本
0.9:最早期版本,只支持GET方法,支持超文本数据传输,没有规范http协议格式
1.0:规范了http协议格式,新增支持GET,HEAD,POST请求方法。支持各种多媒体资源传输,简单缓冲控制
1.1:支持更多请求方法,对1.0进行性能提升,支持长连接(connection:keep-alive)
2.0:重新定义http协议 1,二进制数据传输 2,支持主动推送资源 3,服务器长连接响应,不需要按序进行,解决队头阻塞问题
响应行:协议版本 响应状态码 状态码描述
响应状态码:直观向客户端反映处理结果
分类 | 分类描述 |
---|---|
1** | 一些描述信息,服务器收到请求,需要请求者继续执行操作 |
2** | 成功,操作被成功接收并正确处理 |
3** | 重定向,需要进一步的操作以完成请求,表示本次请求的资源移到新的链接处,原链接依然可用 |
4** | 客户端错误,请求包含语法错误或无法完成请求 |
5** | 服务器错误,服务器在处理请求的过程中发生了错误 |
状态码 | 状态码描述 | 中文描述 |
---|---|---|
100 | Continue | 继续。客户端应继续其请求 |
101 | Switching Protocols | 切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到HTTP的新版本协议 |
200 | OK | 请求成功。一般用于GET与POST请求 |
201 | Created | 已创建。成功请求并创建了新的资源 |
202 | Accepted | 已接受。已经接受请求,但未处理完成 |
203 | Non-Authoritative Information | 非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本 |
204 | No Content | 无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,可确保浏览器继续显示当前文档 |
205 | Reset Content | 重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。可通过此返回码清除浏览器的表单域 |
206 | Partial Content | 部分内容。服务器成功处理了部分GET请求,eg:断点续传 |
300 | Multiple Choices | 多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择 |
301 | Moved Permanently | 永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替 |
302 | Found | 临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI |
303 | See Other | 查看其它地址。与301类似。使用GET和POST请求查看 |
304 | Not Modified | 未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源 |
305 | Use Proxy | 使用代理。所请求的资源必须通过代理访问 |
306 | Unused | 已经被废弃的HTTP状态码 |
307 | Temporary Redirect | 临时重定向。与302类似。使用GET请求重定向 |
400 | Bad Request | 客户端请求的语法错误,服务器无法理解 |
401 | Unauthorized | 请求要求用户的身份认证 |
402 | Payment Required | 保留,将来使用 |
403 | Forbidden | 服务器理解请求客户端的请求,但是拒绝执行此请求 |
404 | Not Found | 服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面 |
405 | Method Not Allowed | 客户端请求中的方法被禁止 |
406 | Not Acceptable | 服务器无法根据客户端请求的内容特性完成请求 |
407 | Proxy Authentication Required | 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权 |
408 | Request Time-out | 服务器等待客户端发送的请求时间过长,超时 |
409 | Conflict | 服务器完成客户端的 PUT 请求时可能返回此代码,服务器处理请求时发生了冲突 |
410 | Gone | 客户端请求的资源已经不存在。410不同于404,如果资源以前有现在被永久删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置 |
411 | Length Required | 服务器无法处理客户端发送的不带Content-Length的请求信息 |
412 | Precondition Failed | 客户端请求信息的先决条件错误 |
413 | Request Entity Too Large | 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息 |
414 | Request-URI Too Large | 请求的URI过长(URI通常为网址),服务器无法处理 |
415 | Unsupported Media Type | 服务器无法处理请求附带的媒体格式 |
416 | Requested range not satisfiable | 客户端请求的范围无效 |
417 | Expectation Failed | 服务器无法满足Expect的请求头信息 |
500 | Internal Server Error | 服务器内部错误,无法完成请求 |
501 | Not Implemented | 服务器不支持请求的功能,无法完成请求 |
502 | Bad Gateway | 作为网关或者代理工作的服务器尝试执行请求时,从远程服务器接收到了一个无效的响应,连接建立失败 |
503 | Service Unavailable | 由于超载或系统维护,服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的Retry-After头信息中 |
504 | Gateway Time-out | 充当网关或代理的服务器,未及时从远端服务器获取请求,响应延迟 |
505 | HTTP Version not supported | 服务器不支持请求的HTTP协议的版本,无法完成处理 |
-
头部:对于请求或响应或正文的一些关键描述(由一个个key:value键值对组成,每个键值对以\\r\\n结尾)
典型头部字段:
Connection | 长短连接控制 | keep-alive/close |
Referer | 记录本次请求的来源连接 | |
Content-Type | 表示正文数据格式 | |
Content-Length | 表示正文数据长度 | 解决粘包问题 |
cookie /session | 请求头cookie 响应头session |
cookie:
一个客户端登录之后,服务端验证登录,成功后,通过set-cookie设置cookie信息返回给客户端 | 客户端接收到响应后,将set-cookie字段的cookie信息保存起来,下次请求服务器直接从cookie文件中读取出cookie信息,通过cookie字段发送给服务器 |
cookie是一个维护http通信状态的技术,但存在安全隐患
解决方法:session
服务端针对每个客户端建立会话当客户端登录成功后,创建会话,在会话中记录客户端用户信息及状态等信息 通过set-cookie字段将session-id返回给客户端 | session-id每次请求都会发生变化,并且用户的隐私信息一直保存在服务器中,防止泄露 |
cookie和session区别:
cookie是维护http通信状态的技术,将关键信息保存在客户端,每次请求服务器时,读取出来发送给服务端,此过程中将关键信息保存在cookie字段中进行传输
session是解决cookie安全隐患,将关键信息保存在服务端,通过创建会话后,而只将session-id返回给客户端,客户端作为cookie字段保存,再次请求过程中只是将session-id信息保存在cookie字段中进行传输,而非直接传输用户信息,安全性相比较于cookie提高
-
空行:\\r\\n 间隔头部与正文
-
正文:客户端提交给服务端,或者服务端响应给客户端的数据
简单的http服务器的搭建:
1.搭建tcp服务端
⒉获取新建连接
3.使用新建连接,等待接收数据(http协议的请求数据)
4.接收过程:先接收http头部,解析头部-Content-Length确定正文长度5.接收指定长度的正文
6.根据请求方法以及资源路径确定客户端的请求目的7.进行具体对应的业务处理
8.组织http协议格式的响应数据,对客户端进行回复
9.如果是短连接,则直接关闭套接字,如果是长连接,则继续等待接收数据
代码如下:
运行结果如下:
抓包结果如下:
以上是关于Java 如何 解析二进制协议?的主要内容,如果未能解决你的问题,请参考以下文章
Java TCP/IP Socket应用程序协议中消息的成帧与解析(含代码)
TCP/IP协议 怎么用JAVA发送和接收二进制数据 要具体实例