Linux自学笔记——套接字与http协议基础
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux自学笔记——套接字与http协议基础 相关的知识,希望对你有一定的参考价值。
WebService
应用层:http,https
传输层协议:TCP, UDP,SCTP
进程间通信:IPC
Socket:ip:port
IANA定义的端口信息:
0-1023:众所周知,永久地分配给固定的应用使用,特权端口;
1024-41951:亦为注册端口,但要求不是特别严格,分配给程序注册为某应用使用:3306/tcp,11211/tcp
41952+:客户端程序随机使用的端口,动态端口,或私有端口:其范围定义在/proc/sys/net/ipv4/ip_local_port_range
BSDSocket:IPC的一种实现,允许位于不同主机(也可以是同一主机)上的进程之间进行通信;
Socket API(封装了内核中的socket通信相关的系统调用)
套接字三种类型:
SOCK_STREAM:tcp套接字
SOCK_DGRAM:UDP套接字
SOCK_RAW:raw套接字
根据套接字所使用的地址格式,Socket Domain
TCPFSM(有限状态机):在tcp传输连接的建立和释放中的通信双方主机的这些状态称之为“有限状态机”
CLOSED:呈阻塞、关闭状态,表示主机当前没有活动的传输连接或正在进行传输连接;
LISTEN:呈监听状态,表示服务器正在等待新的传输连接进入;
SYN RCVD:表示主机已收到一个传输连接请求,但尚未确认;
ESTABLISHED:传输连接建立,通信双方进入正常数据传输状态;
FIN WAIT 1:(主动关闭)主机已经发送关闭连接请求,等待对方确认;
FIN WAIT 2:(主动关闭)主机已收到对方关闭传输连接确认,等待对方发送关闭传输连接请求;
TIMED WAIT:完成双向传输连接关闭,等待所有分组消失;
CLOSING:双方同时尝试关闭传输连接,等待双方确认;
CLOSE WAIT:(被动关闭)收到对方发来的关闭传输连接请求,并已确认;
LAST ACK:(被动关闭)等待最后一个关闭传输连接请求,并等待所有分组消失;
TCP协议的特性:
建立连接:三次握手;
将数据打包成段:校验和(CRC32)
确认、重传及超时;
排序:逻辑序号;
流量控制:滑动窗口算法;
拥塞控制:慢启动和拥塞避免算法;
http协议:
http:hyper text transferprotocol,应用层协议,80/tcp,文本协议
html:hyper text mark language,编程语言,超文本标记语言;
格式:
<html>
<head>
<title>TITLE</title>
</head>
<body>
<h1></h1>
<p>blabla…<ahref=”http://www.magedu.com/download.html”> bla…</a></p>
<h2></h2>
</body>
</html>
http协议版本:
http 0.9:原型版本,功能简陋;
http 1.0:cache, MIME,method,
MIME:MultipurposeInternet Mail Extesion
method:GET, POST, HEAD,PUT, DELETE,TRACE,OPTIONS
http 1.1:缓存功能,条件式请求;
http 2.0:rfc
css:Cascading Style Sheet
js:javascript,客户端脚本;
html文档的生成方式:
静态:
动态:编程语言编写的程序可输出html格式的结果
php,jsp,asp,.net
依赖脚本解释器
php:php解释器
jsp:jvm
工作模式:
http请求报文:http request
http响应报文;http response
一次http事务:请求<-->响应
Web资源:web resourse
静态资源(无须服务端做出额外处理):.jpg,.png, .gif, .html, txt, .js, .css, .mp3, .avi
动态资源(服务端需要通过执行程序做出处理,发送给客户端的是程序运行的结果):.php,.jsp
Note:一个页面中展示的资源可能有多个;每个资源都需要单独请求;
资源标识机制:URL
Uniform Resourse Locator:用于描述服务器某特定资源的位置;
例如:http://www.sina.com.cn/index.html
Scheme://Server[:port][/PATH/TO/SOME_RESOURSE]
一次完整的http请求处理过程:
1) 建立或处理连接;接收请求或拒绝请求;
2) 接受请求:接收来自网络上的主机请求报文中对某特定资源的一次请求过程;
接收请求的模型:
并发访问响应模型:
单进程I/O模型:启动一个进程处理用户请求;这意味着,一次只能处理一个请求,多个请求被串行响应;
多进程I/O结构:并行启动多个进程,每个进程响应一个请求;
复用的I/O结构:一个进程响应n个请求;
多线程模式:一个进程生成n个线程,一个线程处理一个请求;
时间驱动(event-driven):一个进程直接响应n个请求
复用的多进程I/O结构:启动多个(m个)进程,每个进程生成多个(n个)线程;响应的请求的数量:m*n
3) 处理请求;对请求报文进行解析,获取客户端请求的资源及请求方法等相关信息;
分析请求报文http请求报文的首部
http协议:
http请求报文首部;
http响应报文首部;
请求报文首部格式:
<method> <URL> <VERSION>
HEADERS:(name: value)
<request body>
4) 访问资源:获取请求报文中请求的资源;
web服务器,即存放了web资源的主机,负责向请求者提供对方请求的静态资源,或动态资源运行的生成的结果;这些资源通常应该放置于本地文件系统某路径下;此路径称为DocRoot;
/var/www/html/:
Images/logo.jpg
例如:
http://www.claude.com/images/logo.jpg
web服务器的资源路径映射方式:
a. DocRoot
b. 别名;
c. 虚拟主机的docroot
d. 用户家目录的docroot
5) 构建响应报文
6) 发送响应报文;
7) 记录日志;
http请求处理中的连接模式:
保持连接(长连接):keep-alive
时间:
数量:
非保持连接 (短连接):
以上是关于Linux自学笔记——套接字与http协议基础 的主要内容,如果未能解决你的问题,请参考以下文章