Tomcat连接器Connector源码解读架构概览,如何设计?为什么这样设计?
Posted 徐同学呀
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Tomcat连接器Connector源码解读架构概览,如何设计?为什么这样设计?相关的知识,希望对你有一定的参考价值。
首发CSDN:徐同学呀,原创不易,转载请注明源链接。我是徐同学,用心输出高质量文章,希望对你有所帮助。
本篇基于Tomcat10.0.6。
文章目录
一、前言
Tomcat是一个非常优秀的开源项目,深深被它匠心独具的架构理念所折服。技术的思维是互通的,哪有那么多的高深莫测,都是对现实世界的抽象。
Tomcat作为Web应用服务器,接收请求和处理请求是它的两个核心功能。接收请求这步需要考虑适配多种网络协议,主流的是HTTP
协议,还有WebSocket
协议、AJP
协议等;处理请求就是找到对应的Servlet
,执行业务代码。
为了解耦和扩展性,Tomcat 设计了两个核心组件来做这两件事情:
- 连接器(
Connector
)负责对外交流,建立Socket
连接,读取并解析网络字节流,生成Request
和Response
对象并转发给容器。 - 容器(
Container
)负责内部处理,加载和管理Servlet
,通过Response
对象的输出流写入响应结果。
二、Connector基本结构
具体来看看Connector
有哪些功能:
- 监听网络端口。
- 接受网络连接请求。
- 读取网络请求字节流。
- 根据具体应用层协议(
HTTP/AJP
)解析字节流,生成统一的Request
和Response
对象。(需要注意,Connector
为了兼容多种协议,没有耦合Servlet
标准,所以这里生成的Request
和Response
对象没有实现HttpServletRequest
和HttpServletResponse
接口)。 - 将
Request
和Response
对象转换为HttpServletRequest
和HttpServletResponse
对象。 - 将
HttpServletRequest
和HttpServletResponse
对象转发给Container
。
总结就是做了三件事:
- 网络通信。
- 应用层协议解析和封装。
Request
和Response
对象转换和传递。
对应Connector
中的三个组件就是:Endpoint
、Processor
、Adapter
,其中 Endpoint
和 Processor
放在一起抽象成了 ProtocolHandler
协议组件。
三、ProtocolHandler
ProtocolHandler
负责传输层网络连接和应用层协议解析,由两个核心部件 Endpoint
和 Processor
具体做这两件事。
从实现类来看,Tomcat的连接器主要支持两种协议:HTTP/1.1
协议和AJP
协议,实则还支持HTTP/2.0
协议,HTTP/2.0
的处理与HTTP/1.1
和AJP
不同,采用一种升级协议的方式实现。
HTTP/1.1
协议:大家最熟悉的协议了,绝大多数web应用采用的访问协议,Tomcat既是Servlet
容器又是HTTP服务器,单独运行就可以对外提供服务,但是一般会搭配nginx
web服务器做反向代理和负载均衡。HTTP/2.0
协议:自Tomcat8.5开始支持,相较于HTTP/1.1
采用二进制传输数据而非文本格式;对消息头采用HPACK
压缩,提升传输效率;基于帧和流的多路复用,真正实现了基于一个连接多请求并发处理;支持服务器主动推送。AJP/1.3
协议:全名Apache JServ Protocol,是Alexei Kosut创建的定向包通信协议,采用二进制格式传输可读文本。用于集成Web服务器,以提升静态资源的访问性能,当前最新版本为1.3。目前Apache
、Tomcat
、Nginx
、Jetty
、JBoss
等均已支持AJP
。(名不见经传,不过多解释)
除了支持3种协议外,还分别支持3种I/O方式:NIO
、NIO2
、APR
,Tomcat8.5之前默认还支持BIO
,后来因为性能问题直接给删除了,APR也贴上了过期标签。协议和I/O方式两两组合就出现了很多实现类:Http11NioProtocol
、Http11Nio2Protocol
、Http11AprProtocol
(已过期)、AjpNioProtocol
、AjpNio2Protocol
、AjpAjpProtocol
(已过期)。(HTTP/2.0
是在HTTP/1.1
的基础上升级处理的,不在该继承体系内,APR
采用Apache
可移植运行库(c++
编写的本地库,就是native
方法)实现的,官方已标注过期不建议使用,所以不过多解释)
Tomcat采用UpgradeProtocol
表示HTTP升级协议,当前只有一个实现类Http2Protocol
用于处理HTTP/2.0
。它根据请求创建一个用于升级处理的令牌UpgradeToken
,该令牌包含了具体的HTTP升级处理器HttpUpgradeHandler
(HTTP/2.0
的处理器为Http2UpgradeHandler
)。(Tomcat中WebSocket
也是通过UpgradeToken
机制实现的,其处理器为WsHttpUpgradeHandler
)
1、Endpoint通信端点
Endpoint
负责网络通信,监听一个端口,循环接收socket
请求,读取网络字节流等。Endpoint
不是接口,而是提供了一个抽象类AbstractEndpoint
,又根据I/O方式提供了若干实现类:
网络通信这一层是非常抽象的,传输层协议毋庸置疑是TCP/IP
,但是如何监听socket请求,读取网络字节流的方式是多样的,同步非阻塞、I/O多路复用、异步非阻塞等等:
Endpoint
高度抽象出一个Acceptor
来循环监听socket
请求;- Tomcat是支持高并发的,但是机器的性能是有限的,为了保证Web服务器不被高流量冲垮,所以在接收请求前会有一个
LimitLatch
限流器(利用AQS
实现); - 接收到的
socket
通道(SocketChannel
orAsynchronousSocketChannel
),会先根据I/O方式包装一下,如同步非阻塞NioChannel
、异步非阻塞Nio2Channel
等; - 包装之后的
socket
通道又用一个更抽象的SocketWrapper
封装,以应对不同方式的网络字节流的读取和写入; - 出于高并发的设计,将抽象的
SocketWrapper
交由SocketProcessor
任务对象处理,SocketProcessor
会扔进一个线程池Executor
处理; - 为了进一步提高性能,每次处理请求都会把一些对象缓存起来,不重复创建,比如
SocketWrapper
、SocketProcessor
等。
2、Processor应用层协议解析
Acceptor
接收到请求封装成一个SocketProcessor
扔进线程池Executor
后,会调用Processor
从操作系统底层读取、过滤字节流,对应用层协议(HTTP/AJP
)进行解析封装,生成org.apache.coyote.Request
和org.apache.coyote.Response
对象。不同的协议有不同的Processor
,HTTP/1.1
对应Http11Processor
,AJP
对应AjpProcessor
,HTTP/1.2
对应StreamProcessor
,UpgradeProcessorInternal
和 UpgradeProcessorExternal
用于协议升级:
(1)ConnectionHandler创建合适的Processor
SocketProcessor
并不是直接调用的Processor
,而是通过org.apache.coyote.AbstractProtocol.ConnectionHandler#process
找到一个合适的Processor
进行请求处理:
- 根据不同协议创建
Http11Processor
orAjpProcessor
; - 根据协议升级是内部升级(
HTTP/2.0
)还是外部升级创建UpgradeProcessorInternal
orUpgradeProcessorExternal
。
(2)协议升级
如果是正常的协议,如HTTP/1.1
、AJP/1.3
,则Processor#process
处理完请求后会直接调用Adapter#service
,将请求转发给Container
。
如果是协议升级(除Websocket
),首先通过HTTP/1.1进行协议升级:
- 服务器接收到带有特殊请求头(
Upgrade
)的HTPP/1.1
连接,因此仍会先交给Http11Processor
进行处理; - 根据请求头
Upgrade
对应协议名创建UpgradeToken
,并赋值给当前Processor
; - 返回
SocketState.UPGRADING
,再由ConnectionHandler
进行协议升级; ConnectionHandler
会从当前Processor
获取UpgradeToken
对象(如果没有,则默认为HTTP/2.0),并构建一个升级的Processer
(若为Tomcat可以处理的协议升级(HTTP/2.0
、WebSocket
) ,则是UpgradeProcessorInternal
,否则为UpgradeProcessorExternal
)。- 替换当前
Processer
,并将当前Processer
释放回收; - 将
UpgradeProcessor
设置给UpgradeToken
中的HttpUpgradeHandler
,并调用HttpUpgradeHandler.init
进行初始化,开启升级协议的处理。 - 由于
HTTP/2.0
是多路复用协议,一个连接可以处理多个HTTP请求,所以对于Http2UpgradeHandler
,会将每次请求响应交于StreamProcessor
处理,再由StreamProcessor
将请求提交给Container
。
注意:
UpgradeProcessorInternal
和UpgradeProcessorExternal
都实现了接口WebConnection
,表示一个用于升级的连接,并不处理协议升级后数据读写和解析,而是交由HttpUpgradeHandler
,对于Http2UpgradeHandler
再构建StreamProcessor
,又将StreamProcessor
包装成任务类StreamRunnable
,扔进线程池Executor
处理。WebSocket
也属于协议升级,和HTTP/2.0
升级方案一致,但是协议升级的判断机制有所不同,WebSocket
升级判断不在连接器里,而是交由Servlet
容器通过当前请求的过滤器WsFilter
判断,如果是WebSocket
协议升级,则调用当前org.apache.catalina.connector.Request#upgrade
构建UpgradeToken
并传递给Http11Processor
处理(调用钩子函数org.apache.coyote.AbstractProcessor#action
),之后到了ConnectionHandler
逻辑就跟HTTP/2.0
升级差不多了。
3、配置方式
<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
executor="tomcatThreadPool"
redirectPort="8443">
<UpgradeProtocol className="org.apache.coyote.http2.Http2Protocol"/>
</Connector>
port
是Connector
监听的端口。protocol
是应用层协议名,可填参数有HTTP/1.1
、org.apache.coyote.http11.Http11NioProtocol
、AJP/1.3
、org.apache.coyote.ajp.AjpNioProtocol
,如果protocol
不填,则默认为Http11NioProtocol
。connectionTimeout
表示Connector
接收到连接后等待超时时间,单位毫秒,默认20秒。executor
表示使用一个共享线程池,若使用私有线程池,则executor
不需要指定,私有线程池可选参数有minSpareThreads=“10”
、maxThreads=“200”
等redirectPort
表示非SSL
重定向到SSL
端口,当请求是non-SSL
请求,但是接收到的请求内容需要SSL
传输,则重定向到SSL
端口。- 若为
HTTP
开启HTTP/2.0
支持,需要配置UpgradeProtocol
。
四、Adapter
Adapter
接口只有一个实现类org.apache.catalina.connector.CoyoteAdapter
,其主要职责如下:
- 将
org.apache.coyote.Request
和org.apache.coyote.Response
转为实现了标准Servlet
的org.apache.catalina.connector.Request
和org.apache.catalina.connector.Response
。 - 将请求体的
serverName
、URI
、version
传给Mapper
组件做映射,匹配到合适的Host
、Context
、Wrapper
。 - 将
Request
和Response
传给Container
处理,Engine
通过管道Pipeline
传给Host
,Host
再传给Context
,Context
再传给Wrapper
,Wrapper
是最终的Servlet
。
五、请求处理完整流程
六、要点回顾
任重而道远啊,本篇主要从Connector
的整体架构进行讲解,主要弄明白Connector
是如何设计的?为什么要这样设计?
Connector
作为独立模块,封装底层网络通信,使Container
和具体的协议及I/O方式解耦,易扩展、高性能。这也使得架构变得抽象复杂,Connector
需要应对多种协议和I/O方式的组合,高度的抽象和封装。Connector
只负责接收和解析请求,具体的业务处理还需要交给Container
,所以需要一个适配器作为Connector
和Container
连接的桥梁。
很多实现细节并没有展开,比如:
Endpoint
的工作原理没有展开,如何监听请求?如何限流?如何封装接收到的socket
?如何将连接扔进线程池里处理?Processor
应用层协议解析原理没有展开,如何读取底层字节流?如何解析封装应用层协议?如何封装生成Request
和Response
?- 适配器
Adapter
如何做转发?如何找到对应的Host
、Context
、Wrapper
。
涉及的知识点很多,比如:
- 对传输层协议
TCP/IP
的理解。 - 对I/O模型的理解(I/O多路复用、同步非阻塞、异步非阻塞等)。
- 对传输层协议的理解(HTTP协议真的要掌握,不然真看不懂代码是怎么解析请求行、请求头、请求体的)。
- 高并发架构设计(缓存、
Reactor
响应式、传输层协议延迟加载)。
后续会一一讲解。
七、参考文献
- 书籍:《Tomcat架构解析》刘光瑞(Tomcat8.5)
- 书籍:《Tomcat内核设计剖析》汪建(Tomcat7)
- 极客时间:《深入拆解Tomcat & Jetty》李号双(Tomcat9.x)
- Tomcat源码:https://gitee.com/stefanpy/tomcat-source-code-learning (Tomcat10.0.6)
如若文章有错误理解,欢迎批评指正,同时非常期待你的留言和点赞。如果觉得有用,不妨点个在看,让更多人受益。
以上是关于Tomcat连接器Connector源码解读架构概览,如何设计?为什么这样设计?的主要内容,如果未能解决你的问题,请参考以下文章
基于之前案例的感性认识,Tomcat连接器源码解读2---连接器与其中HttpProcessorresponserequest等对象的关系