Linux自学笔记——套接字与http协议基础  

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux自学笔记——套接字与http协议基础  相关的知识,希望对你有一定的参考价值。


 

 

WebService

应用层:http,https

传输层协议:TCP, UDP,SCTP

进程间通信:IPC

      Socket:ip:port

IANA定义的端口信息:

      0-1023:众所周知,永久地分配给固定的应用使用,特权端口;

      1024-41951:亦为注册端口,但要求不是特别严格,分配给程序注册为某应用使用:3306/tcp,11211/tcp

      41952+:客户端程序随机使用的端口,动态端口,或私有端口:其范围定义在/proc/sys/net/ipv4/ip_local_port_range

BSDSocket:IPC的一种实现,允许位于不同主机(也可以是同一主机)上的进程之间进行通信;

      Socket API(封装了内核中的socket通信相关的系统调用)

      套接字三种类型:

           SOCK_STREAM:tcp套接字

           SOCK_DGRAM:UDP套接字

           SOCK_RAW:raw套接字

      根据套接字所使用的地址格式,Socket Domain

TCPFSM(有限状态机):在tcp传输连接的建立和释放中的通信双方主机的这些状态称之为“有限状态机”

      CLOSED:呈阻塞、关闭状态,表示主机当前没有活动的传输连接或正在进行传输连接;

      LISTEN:呈监听状态,表示服务器正在等待新的传输连接进入;

      SYN RCVD:表示主机已收到一个传输连接请求,但尚未确认;

      ESTABLISHED:传输连接建立,通信双方进入正常数据传输状态;

      FIN WAIT 1:(主动关闭)主机已经发送关闭连接请求,等待对方确认;

      FIN WAIT 2:(主动关闭)主机已收到对方关闭传输连接确认,等待对方发送关闭传输连接请求;

      TIMED WAIT:完成双向传输连接关闭,等待所有分组消失;

      CLOSING:双方同时尝试关闭传输连接,等待双方确认;

      CLOSE WAIT:(被动关闭)收到对方发来的关闭传输连接请求,并已确认;

      LAST ACK:(被动关闭)等待最后一个关闭传输连接请求,并等待所有分组消失;

TCP协议的特性:

      建立连接:三次握手;

      将数据打包成段:校验和(CRC32)

      确认、重传及超时;

      排序:逻辑序号;

      流量控制:滑动窗口算法;

      拥塞控制:慢启动和拥塞避免算法;

 

http协议:

http:hyper text transferprotocol,应用层协议,80/tcp,文本协议

      html:hyper text mark language,编程语言,超文本标记语言;

      格式:

      <html>

           <head>

                 <title>TITLE</title>

           </head>

           <body>

                 <h1></h1>

                      <p>blabla…<ahref=”http://www.magedu.com/download.html”> bla…</a></p>

                 <h2></h2>

           </body>

      </html>

      http协议版本:

           http 0.9:原型版本,功能简陋;

           http 1.0:cache, MIME,method,                    

                      MIME:MultipurposeInternet Mail Extesion

                      method:GET, POST, HEAD,PUT, DELETE,TRACE,OPTIONS

           http 1.1:缓存功能,条件式请求;

           http 2.0:rfc

      css:Cascading Style Sheet

      jsjavascript,客户端脚本;

      html文档的生成方式:

           静态:

           动态:编程语言编写的程序可输出html格式的结果

                 php,jsp,asp,.net

                 依赖脚本解释器

                      php:php解释器

                      jsp:jvm

      工作模式:

           http请求报文:http request

           http响应报文;http response

                 一次http事务:请求<-->响应

      Web资源:web resourse

           静态资源(无须服务端做出额外处理):.jpg,.png, .gif, .html, txt, .js, .css, .mp3,  .avi

           动态资源(服务端需要通过执行程序做出处理,发送给客户端的是程序运行的结果):.php,.jsp

           Note:一个页面中展示的资源可能有多个;每个资源都需要单独请求;

 

           资源标识机制:URL

                 Uniform Resourse Locator:用于描述服务器某特定资源的位置;

                      例如:http://www.sina.com.cn/index.html

                            Scheme://Server[:port][/PATH/TO/SOME_RESOURSE]

一次完整的http请求处理过程:

1)    建立或处理连接;接收请求或拒绝请求;

2)    接受请求:接收来自网络上的主机请求报文中对某特定资源的一次请求过程;

接收请求的模型:

  并发访问响应模型:

单进程I/O模型:启动一个进程处理用户请求;这意味着,一次只能处理一个请求,多个请求被串行响应;

     多进程I/O结构:并行启动多个进程,每个进程响应一个请求;

     复用的I/O结构:一个进程响应n个请求;

          多线程模式:一个进程生成n个线程,一个线程处理一个请求;

          时间驱动(event-driven):一个进程直接响应n个请求

复用的多进程I/O结构:启动多个(m个)进程,每个进程生成多个(n个)线程;响应的请求的数量:m*n

3)    处理请求;对请求报文进行解析,获取客户端请求的资源及请求方法等相关信息;

分析请求报文http请求报文的首部

http协议:

  http请求报文首部;

  http响应报文首部;

请求报文首部格式:

  <method> <URL> <VERSION>

  HEADERS:(name: value)

  <request body>

4)    访问资源:获取请求报文中请求的资源;

web服务器,即存放了web资源的主机,负责向请求者提供对方请求的静态资源,或动态资源运行的生成的结果;这些资源通常应该放置于本地文件系统某路径下;此路径称为DocRoot;

  /var/www/html/:

        Images/logo.jpg

  例如:

        http://www.claude.com/images/logo.jpg

  web服务器的资源路径映射方式:

a.     DocRoot

b.    别名;

c.     虚拟主机的docroot

d.    用户家目录的docroot

5)    构建响应报文

6)    发送响应报文;

7)    记录日志;

 

http请求处理中的连接模式:

  保持连接(长连接):keep-alive

       时间:

       数量:

  非保持连接 (短连接):

 


以上是关于Linux自学笔记——套接字与http协议基础  的主要内容,如果未能解决你的问题,请参考以下文章

Linux自学笔记——OpenSSL命令行工具

Linux 套接字通信笔记

5GC基础自学系列 | 5GC协议系列之SBI接口HTTP2

Linux自学笔记——Linux网络基础命令及属性配置

Linux自学笔记——keepalived

Linux自学笔记——mysql基础备份和恢复主从复制MHA