大厂每日面试Tomcat的连接器是如何设计的?
Posted JavaEdge.
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大厂每日面试Tomcat的连接器是如何设计的?相关的知识,希望对你有一定的参考价值。
导读
为什么要学习Tomcat的设计思路,对我们这些 crud 工程师有用吗?现代背景下,我们不仅可以学到Tomcat的架构,学会从宏观上怎么去设计一个复杂系统,怎么设计顶层模块,以及模块之间关系。
Tomcat总体架构
Tomcat主要实现了2个核心功能:
- 处理Socket连接,负责网络字节流与Request和Response对象的转化
- 加载和管理Servlet,以及具体处理Request请求
因此Tomcat设计了两个核心组件:
- 连接器(Connector)
负责对外交流 - 容器(Container)
负责内部处理。
Tomcat支持哪些I/O模型呢?
- NIO
非阻塞I/O,采用Java NIO类库实现。 - NIO.2
异步I/O,采用JDK 7最新的NIO.2类库实现。 - APR
采用Apache可移植运行库实现,是C/C++编写的本地库。
Tomcat支持哪些应用层协议呢?
- HTTP/1.1
大部分Web应用采用的访问协议。 - AJP
用于和Web服务器集成(如Apache)。 - HTTP/2
HTTP 2.0大幅度的提升了Web性能。
Service
Tomcat为支持多种I/O模型和应用层协议,一个容器可能对接多个连接器。
但单独的连接器或容器都无法对外提供服务,需组装起来才能正常工作,组装后的整体称为Service组件。
Service只是在连接器和容器外面多包了一层,把它们组装在一起。
Tomcat内可能有多个Service,通过在Tomcat中配置多个Service,可实现通过不同端口号访问同一台机器上部署的不同应用。
最顶层是Server(即一个Tomcat实例)。一个Server中有一或多个Service,一个Service中有多个连接器和一个容器。
连接器与容器之间通过标准的ServletRequest和ServletResponse通信。
连接器
连接器对Servlet容器屏蔽了协议及I/O模型等的区别,无论是HTTP还是AJP,在容器中获取到的都是一个标准的ServletRequest对象。
连接器的详细功能:
- 监听网络端口
- 接受网络连接请求
- 读取网络请求字节流
- 根据具体应用层协议(HTTP/AJP)解析字节流,生成统一的Tomcat Request对象
- 将Tomcat Request对象转成标准的ServletRequest
- 调用Servlet容器,得到ServletResponse
- 将ServletResponse转成Tomcat Response对象
- 将Tomcat Response转成网络字节流
- 将响应字节流写回给浏览器。
提完了需求,就需要考虑它应该有哪些子模块呢?
优秀的模块化设计应该考虑高内聚、低耦合。通过分析连接器的功能,发现连接器需要完成如下高内聚的功能:
- 网络通信
- 应用层协议解析
- Tomcat Request/Response与ServletRequest/ServletResponse的转化
因此Tomcat的设计者设计了3个组件来实现这3个功能:Endpoint、Processor和Adapter。
组件之间通过抽象接口交互。这样做还有一个好处是封装变化。这是面向对象设计的精髓,将系统中经常变化的部分和稳定的部分隔离,有助于增加复用性,并降低系统耦合度。
不管网络通信I/O模型、应用层协议、浏览器端发送的请求信息如何变化,但整体处理逻辑不变:
- Endpoint
提供字节流给Processor - Processor
提供Tomcat Request对象给Adapter - Adapter
提供ServletRequest对象给容器
如果要支持新的I/O方案、新的应用层协议,只需要实现相关具体子类,上层通用的处理逻辑不会变。
由于I/O模型和应用层协议可自由组合,比如NIO + HTTP或者NIO.2 + AJP。Tomcat的设计者将网络通信和应用层协议解析放在一起考虑,设计ProtocolHandler接口,封装这两种变化点。各种协议和通信模型的组合有相应的具体实现类。
比如:Http11NioProtocol和AjpNioProtocol
除了这些变化点,系统也存在一些相对稳定部分,因此Tomcat设计了一系列抽象基类来封装这些稳定部分,抽象基类AbstractProtocol实现了ProtocolHandler接口。每一种应用层协议有自己的抽象基类,比如AbstractAjpProtocol和AbstractHttp11Protocol,具体协议的实现类扩展了协议层抽象基类。
这样设计是为尽量将稳定的部分放到抽象基类,同时每一种I/O模型和协议的组合都有相应的具体实现类,我们在使用时可以自由选择。
连接器模块的核心组件:
- Endpoint
- Processor
- Adapter
Endpoint和Processor放在一起抽象成了ProtocolHandler组件
顶层组件
ProtocolHandler组件
连接器用ProtocolHandler处理网络连接、应用层协议,包含如下重要部件
Endpoint
通信端点,即通信监听的接口,是具体的Socket接收和发送处理器,是对传输层的抽象,因此Endpoint用来实现TCP/IP协议。
Endpoint是一个接口,对应的抽象实现类是AbstractEndpoint,而AbstractEndpoint的具体子类,比如在NioEndpoint和Nio2Endpoint中,有两个重要的子组件:Acceptor和SocketProcessor。
Acceptor
用于监听Socket连接请求。SocketProcessor用于处理接收到的Socket请求,它实现Runnable接口,在run方法里调用协议处理组件Processor进行处理。
为了提高处理能力,SocketProcessor被提交到线程池来执行。而这个线程池叫作执行器(Executor)。
Processor
Processor用来实现应用层的HTTP协议,接收来自Endpoint的Socket,读取字节流解析成Tomcat Request和Response对象,并通过Adapter将其提交到容器处理。
Processor是一个接口,定义了请求的处理等方法。它的抽象实现类AbstractProcessor对一些协议共有的属性进行封装,没有对方法进行实现。具体的实现有AjpProcessor、Http11Processor等,这些具体实现类实现了特定协议的解析方法和请求处理方式。
连接器的组件图:
Endpoint接收到Socket连接后,生成一个SocketProcessor任务提交到线程池处理,SocketProcessor的run方法会调用Processor组件去解析应用层协议,Processor通过解析生成Request对象后,会调用Adapter的Service方法。
一个连接器对应一个监听端口,比如一扇门,一个web应用是一个业务部门,进了这个门后你可以到各个业务部门去办事。
Tomcat配置的并发数是endpoint里那个线程池。
Adapter
由于协议不同,客户端发过来的请求信息也不尽相同,Tomcat定义了自己的Request类来“存放”这些请求信息。
ProtocolHandler接口负责解析请求并生成Tomcat Request类,但这个Request对象不是标准ServletRequest,不能用Tomcat Request作为参数调用容器。
于是Tomcat引入CoyoteAdapter,连接器调用CoyoteAdapter的sevice方法,传入Tomcat Request对象,CoyoteAdapter负责将Tomcat Request转成ServletRequest,再调用容器的service方法。
连接器用ProtocolHandler接口来封装通信协议和I/O模型的差异,ProtocolHandler内部又分为Endpoint和Processor模块,Endpoint负责底层Socket通信,Processor负责应用层协议解析。连接器通过适配器Adapter调用容器。
为什么要多一层adapter?
在processor直接转换为容器的servletrequest和servletresponse是否更好,为何先转化为Tomcat的request和response,再用adapter做一层转换消耗性能?
若连接器直接创建ServletRequest、ServletResponse,就和Servlet协议耦合,连接器尽量保持独立性,它不一定要跟Servlet容器工作。
对象转化的性能消耗还是比较少的,Tomcat对HTTP请求体采取了延迟解析策略,即TomcatRequest对象转化成ServletRequest时,请求体的内容都还没读取,直到容器处理这个请求的时候才读取。
Adapter一层使用的是适配器设计模式,好处是当容器版本升级只修改Adaper组件适配到新版本容器就可以了,protocal handler组件代码不需要改动。
FAQ
如何设计复杂系统
首先要分析需求,根据高内聚低耦合的原则确定子模块,然后找出子模块中的变化点和不变点,用接口和抽象基类去封装不变点,在抽象基类中定义模板方法,让子类自行实现抽象方法,也就是具体子类去实现变化点。
tomcat和netty有什么区别呢?为什么netty常常用做底层通讯模块,而tomcat作为web容器呢?
可以把Netty理解成Tomcat中的连接器,它们都负责网络通信,都利用了NIO。但Netty素以高性能高并发著称,为什么Tomcat不把连接器替换成Netty呢?
- Tomcat的连接器性能已经足够好了,同样是Java NIO编程,底层原理差不多
- Tomcat做为Web容器,需要考虑到Servlet规范,Servlet规范规定了对HTTP Body的读写是阻塞的,因此即使用到了Netty,也不能充分发挥它的优势。所以Netty一般用在非HTTP协议和Servlet的场景下。
以上是关于大厂每日面试Tomcat的连接器是如何设计的?的主要内容,如果未能解决你的问题,请参考以下文章
05 | Tomcat系统架构(上): 连接器是如何设计的?
Java岗大厂面试百日冲刺 - 日积月累,每日三题Day51—— tomcat
Java岗大厂面试百日冲刺 - 日积月累,每日三题Day51—— tomcat
提问率高达 98%!近期 BATJ 大厂 Java 岗高频面试题~