[Java] 分布式消息队列（MQ）

Posted 2021-03-01 cxc1357

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了[Java] 分布式消息队列（MQ）相关的知识，希望对你有一定的参考价值。

概述

场景

服务解耦
削峰填谷
异步化缓冲：最终一致性/柔性事务

MQ应用思考点

生产端可靠性投递
消费端幂等：消息只能消费一次
高可用、低延迟、可靠性
消息堆积能力
可扩展性

业界主流MQ

ActiveMQ：适合传统需求，并发性差
RabbitMQ：扩展性差
RocketMQ：扩展性强
Kafka：扩展性强，并发性强，可靠性差

技术选型

性能、优缺点、业务场景
集群架构模式，分布式、可扩展、高可用、可维护性
综合成本，集群规模，人员成本
未来的方向、规划、思考

ActiveMQ

介绍

JMS（Java Message Service）：Java消息服务，定义了Java中访问消息中间件的接口规范
实现JMS的中间件称为“JMS Provider”
MOM （Message Oriented Middleware 消息中间件）：ActiveMQ、RocketMQ、RabbitMQ、Kafka

术语

JMS（Java Message Service）：Java消息服务接口
Provider（MessageProvider）：消息的生产者
Consumer（MessageConsumer）：消息的消费者
PTP（Point to Point）：即点对点的消息模型，这也是非常经典的模型
Pub / Sub（Publish/Subscribe）：，即发布/订阅的消息模型
Queue：队列目标，也就是我们常说的消息队列，一般都是会真正的进行物理存储
Topic：主题目标
ConnectionFactory：连接工厂，JMS 用它创建连接
Connection：JMS 客户端到JMS Provider 的连接
Destination：消息的目的地
Session：会话，一个发送或接收消息的线程（这里Session可以类比Mybatis的Session）

消息定义格式

StreamMessage：原始值的数据流
MapMessage：一套名称/值对
TextMessage：一个字符串对象
BytesMessage：一个未解释字节的数据流
ObjectMessage：一个序列化的Java对象

消息投递模式

点对点：生产者向队列投递消息，只有一个消费者能监听到这条消息

发布订阅：生产者向队列投递一条消息，所有监听该队列的消费者都能够监听得到这条消息

ActiveMQ各项指标

服务性能：适用于传统行业需求，对高并发、大数据的业务场景支持不足
数据存储：默认为kahadb存储（索引--文件），可采用google leveldb（内存数据库），或mysql/Oracle（关系型数据库）
集群架构：可与zookeeper构建主备集群模型

集群架构模式

Master-Slave：主从模式，双机热备
- 目前ActiveMQ推荐的高可靠性和容错的解决方案
- 绿色的为主节点，灰色的则为备份节点，这两个节点都是运行状态的
- zookeeper的作用：主节点宕机时，及时切换到备份的灰色节点，进行主从角色互换，以实现高可用性
- 缺陷：不能做到分布式的topic、queue，消息量巨大时MQ集群压力过大

Network：网络通信方式（Network of brokers）
- 真正解决了分布式消息存储和故障转移，broker切换的问题
- 一个broker会同等对待所有的subscription
- 需要两套或多套（Master-Slave）的集群模型实现
- 缺陷：资源浪费，部署复杂

1 <broker brokerName="receiver" persistent="false" useJmx="false">
2      <transportConnectors>
3          <transportConnector uri="tcp://localhost:62002"/>
4      </transportConnectors>
5      <networkConnectors>
6         <networkConnector 
7               uri="static:( tcp://localhost:61616,tcp://remotehost:61616)"/>
8      </networkConnectors>
9 </broker>

RocketMQ

介绍

高并发、高可靠性、海量数据场景
底层通信框架采用Netty NIO
用NameServer代替Zookeeper
支持集群、负载均衡、水平扩展
灵拷贝，顺序写，随机读
消息失败重试机制，消息可查询

术语

Producer：消息生产者，负责产生消息，一般由业务系统负责产生消息
Consumer：消息消费者，负责消费消息，一般是后台系统负责异步消费
Push Consumer：Consumer的一种，需要向Consumer对象注册监听
Pull Consumer：Consumer的一种，需要主动请求Broker拉取消息
Producer Group：生产者集合，一般用于发送一类消息
Consumer Group：消费者集合，一般用于接受一类消息进行消费
Broker ： MQ消息服务（中转角色，用于消息存储与生产消费转发）

集群架构

单点模式
主从模式
双主模式
双主双从模式

RabbitMQ

概述

实现了高级消息队列协议（AMQP）的开源消息代理软件（亦称面向消息的中间件）

集群架构

主备模式：warren（兔子窝），主节点挂了，从节点提供服务，类似ActiveMQ利用Zookeeper做主/备
远程模式：远距离通信和复制，实现双活模式，简称Shovel模式，配置复杂
镜像模式：高可用，数据同步，实现简单，三节点，类似MongoDB的replicate

多活模式：采用双中心模式，两套数据中心各部署一套RabbitMQ集群，各中心间实现部分队列消息共享
- Federation插件：不需构建Cluster，在Broker间传递消息的高性能插件，使用AMQP协议，可接受不连续的传输
- Federation Exchange：Downstream从Upstream主动拉取订阅的消息

Kafka

介绍

基于Pull的模式处理消息消费，追求高吞吐量，开始的目的是用于日志收集和传输
支持复制，不支持事务，对消息的重复、错误、丢失没有严格要求
适合产生大量数据的互联网服务的数据收集业务
分布式、跨平台、实时性、伸缩性

性能

顺序写
- 提高磁盘利用率
- consumer通过offset顺序消费数据，而不删除已消费过的数据，从而避免随机写
Page Cache（空中接力）
- 不显式用内存，重启数据不丢失
高性能，高吞吐
后台异步、主动Flush
- 多个异步级别的scheduler，将连续小块组成大的物理文件
预读策略、IO调度

Page Cache

操作系统级别实现的一种主要磁盘存储策略
把磁盘中的数据缓存到内存中，减少IO操作（四次拷贝）
高并发互联网项目：MySQL->分库分表->MongoDB->Redis->本地缓存

ZeroCopy

与应用程序不关联（一次拷贝）
从磁盘拷贝到内存读取缓冲区后，直接把数据发送到网卡接口，给消费者使用
应用程序不做copy
如有10个消费者，传统文件读写需要40次IO操作，ZeroCopy只需1+10次

集群

以上是关于[Java] 分布式消息队列（MQ）的主要内容，如果未能解决你的问题，请参考以下文章