Kafka vs RabbitMQ

1. RabbitMQ#

1.1. 优缺点#

协议与消息模型灵活 RabbitMQ 基于 AMQP，可以实现多种路由策略（Direct、Fanout、Topic、Headers 等），在工作队列、发布订阅、RPC 等模式下都有成熟支持, 对编程语言、协议的兼容性好（STOMP、MQTT、AMQP 等）
低延迟 对于单条消息的快速投递、即时消费，RabbitMQ 的延迟通常可以控制在微秒到毫秒级，特别适合传统应用内的即时通信或实时响应业务
吞吐量较难达到 Kafka 的级别 RabbitMQ 也支持集群，但对于大规模数据流场景，其扩展性和稳定性往往不及 Kafka（轻量级队列系统与大数据流平台设计初衷不同）
消息持久化开销 若需要实现高可用持久化（开启镜像队列、确认机制、磁盘持久化等），在吞吐量和存储成本上会有一定牺牲
生态对于实时计算弱 相比 Kafka 自带或社区中完善的数据处理组件，RabbitMQ 主要聚焦在消息路由和队列本身，对大数据实时处理场景支持有限

AMQP Advanced Message Queuing Protocol, 是一种开放标准的应用层协议, AMQP 的核心目标是实现跨平台、跨语言的互操作性, AMQP 的主要组件包括：

交换机（Exchange）：负责接收生产者发送的消息，并根据路由规则将消息分发到合适的队列

队列（Queue）：存储消息的地方，消费者从队列中获取消息

绑定（Binding）：交换机和队列之间的关联，定义了消息的路由规则

路由键（Routing Key）：用于匹配消息和队列的标识

它支持多种工作模式, 简单模式, 工作队列模式, 发布/订阅模式, 路由模式等

1.2. 使用场景#

传统应用中的异步处理

比如 Web 后端业务系统，需要快速返回请求，将后续的处理放到消息队列里异步执行
场景：下单后异步扣库存、发送通知邮件、短信等

实时通信或低延迟请求

需要消息在亚毫秒到毫秒级延迟内到达消费者进行处理
场景：实时消息推送、微服务 RPC、在线聊天系统等

多种路由策略

RabbitMQ 丰富的交换机（Exchange）类型可以满足复杂业务路由需求：如按不同 RoutingKey 分发给不同队列

2. Kafka#

2.1. 优缺点#

高吞吐量和可扩展性

核心功能是面向高吞吐量、可扩展性以及持久化的日志系统
Kafka 通过 Partition 进行横向扩展，可支持海量消息的高并发写入与读取
整体架构设计适合大规模分布式部署

持久化与顺序读取

Kafka 中所有消息被持久化到磁盘，默认设置下也会进行副本（Replication）存储，故障恢复快、可靠性强
消费端通过 offset（偏移量）来定位消息

完善的生态 Kafka Streams、ksqlDB、Connect 等组件支持实时计算、数据管道构建，便于与大数据体系对接（例如 Spark、Flink 等）

消息投递不是严格的实时 Kafka 侧重批量、流式吞吐量，延迟（Latency）相对于某些传统消息队列来说会稍高, 通常在毫秒到秒级，适合高吞吐场景

消息模型相对简单 Kafka 更强调分区、顺序的日志模型，在交换机/路由等维度的功能相比 RabbitMQ 等 AMQP 消息队列要简单一些

相对复杂的运维与管理 集群依赖 ZooKeeper，对运维人员有一定要求

为什么 RabbitMQ 低延迟, 吞吐量却没 Kafka 高?

吞吐量可以简单理解为每秒可以稳定处理 10 万条消息, 这就是高吞吐量, 延迟是指一条消息从 Producer 发送, 到 Consumer 收到并确认, 花了 5ms, 这就是“延迟”, 延迟更低意味着对单条消息来说, 响应更快, 低延迟通常意味着对每条消息采取“及时处理”的方式, 减少批量, 高吞吐量往往依赖批量发送、批量压缩、以及并行处理等技术手段

RabbitMQ 可能对单个消息进行直接的推送模式，没什么额外开销，特别是如果是内存队列或者轻量持久化，所以其单条消息可在很短时间内被消费

Kafka 在架构上着重于分区扩展、顺序写磁盘、批量 I/O，并且往往部署在多 Broker 的分布式集群上，能轻松承载数万至数十万甚至更高 TPS 的数据写入和消费, 对单条消息而言，可能有毫秒到秒级的等待时间，但在单位时间内可以处理非常庞大的消息总量（高吞吐量）

2.2. 使用场景#

大数据、日志收集

大量日志、事件实时进入 Kafka，再对接下游 Spark、Flink、Hadoop 等进行数据分析、存储或流式处理
场景：电商订单流水、用户行为日志收集等

实时流处理与监控

配合 Kafka Streams、ksqlDB 或第三方流处理框架做实时数据分析、监控报警
场景：金融实时风控、监控数据聚合等

事件驱动架构

微服务之间通过 Kafka 进行解耦，可实现高吞吐的异步通信与事件广播
场景：大型互联网应用中，后端微服务之间的异步处理

3. 总结#

高吞吐量 + 大规模数据流 + 实时/离线分析场景 → Kafka

如果系统需要承受海量数据的写入与消费（几十万甚至几百万级别的 TPS），并且需要对接大数据生态做后续处理，那么 Kafka 更合适
Kafka 提供 Partition 级别的横向扩展和日志存储模型，对历史消息也能回溯

轻量级任务队列 + 多种路由策略 + 低延迟场景 → RabbitMQ

如果你需要传统消息队列（AMQP）模型，以及在微服务中实现更灵活的路由或通信，RabbitMQ 的实现成本更低、生态成熟
适合相对中等规模的消息量，对延迟敏感性较高的系统

内部服务间的简单解耦

小规模场景下，RabbitMQ 足以胜任；大规模或预期未来数据量剧增，则可考虑一次性上 Kafka 以免后期大量迁移

从业务需求层面考虑：

是否需要回放消息？ 如果经常需要回放/重放，Kafka 的分区存储和 offset 机制十分方便
是否需要强大的流处理生态？ 如果需要针对实时数据做流计算和分析，Kafka 生态支持更完善
是否需要复杂路由规则？ RabbitMQ 的交换机模型在复杂路由上可能更具灵活性