当前位置：首页 > news >正文

Kafka 核心使用机制总结

news 来源：原创 2025/4/24 10:34:33

Kafka 核心使用机制总结

Kafka 核心使用机制总结
- 1. 分区 (Partitions) - 实现伸缩性与并行处理
- 2. 副本 (Replicas) / 复制因子 (Replication Factor) - 实现高可用与容错
- 3. 消费者组 (Consumer Groups) - 控制消息分发与消费进度
- 4. 数据保留策略 (Retention Policies) - 管理存储空间
- 5. Kafka 功能测试示例 (`test-topic`)

Kafka 核心使用机制总结

1. 分区 (Partitions) - 实现伸缩性与并行处理

概念: 一个 Kafka 主题 (Topic) 可以被划分为一个或多个分区。每个分区是一个独立的、有序的日志流。
目的: 主要为了提高 Kafka 的伸缩性 (Scalability) 和吞吐量 (Throughput)。
- 并行写入: 生产者可以同时向不同分区发送消息。
- 并行消费: 一个消费者组内的多个消费者实例可以同时从不同的分区读取消息。
我们设置了 3 个分区: 对于 test-topic（下文测试示例），设置 3 个分区允许最多 3 个属于同一个消费者组的消费者实例并行工作，每个实例负责一个分区。
顺序保证: Kafka 只保证在一个分区内部的消息是严格有序的。不同分区之间的消息顺序不保证。
注意: 一条消息只会属于一个分区。

2. 副本 (Replicas) / 复制因子 (Replication Factor) - 实现高可用与容错

概念: 为了数据冗余和故障恢复，每个分区可以有多个副本，这些副本必须分布在不同的 Broker 节点上。
复制因子: 指每个分区总共的副本数量（1 个 Leader + N 个 Follower）。
Leader 与 Follower: 每个分区有且仅有一个 Leader 副本负责处理所有读写请求，其他 Follower 副本从 Leader 同步数据。
高可用性: 如果持有 Leader 副本的 Broker 宕机，Kafka 会自动从同步的 Follower 中选举出新的 Leader，确保服务几乎不中断且数据不丢失。
我们设置了 3 个副本 (复制因子=3): 在 3 节点的 Kafka 集群中，设置复制因子为 3 是最高容错配置。test-topic

相关文章：

ADW600防护等级与电气安全设计要点详解

MCU开发学习记录11 - ADC学习与实践(HAL库) - 单通道ADC采集、多通道ADC采集、定时器触发连续ADC采集 - STM32CubeMX

从零到精通：探索GoFrame框架中gcron的定时任务之道 —— 优势、实践与踩坑经验

Java的JUC详细全解

Kotlin高阶函数 vs Lambda表达式：关键区别与协作关系

深度探究获取淘宝商品数据的途径|API接口|批量自动化采集商品数据

小学数学出题器：自动化作业生成

智能指针(weak_ptr )之三

equals与hashCode的关系探究

一、环境的安装 Anaconda + Pycharm + PaddlePaddle

火山云生态的体现

容器内部无法访问宿主机服务的原因及解决方法

深入解析：RocketMQ、RabbitMQ和Kafka的区别与使用场景

MySQL的日志--Redo Log【学习笔记】

opencv--图像

Synternet数据流正式上线Google Cloud Web3

Vue3 模板语法

AIGC架构与原理

gem5教程第四章了解gem5统计和输出

Spring Cloud Eureka 与 Nacos 深度解析：从架构到对比

山西国道塌方致55岁货车司机死亡，女儿：货车的车贷还要还

明日出征！航天员详细信息来啦

“中华优秀科普图书榜”2024年度榜单揭晓

“沉默”的智驾：余承东不喊“遥遥领先”，何小鹏连夜改口 | 电厂

直播中抢镜“甲亢哥”的翁东华卸任！此前任文和友小龙虾公司董事

上海优化餐企发展环境：装修拓展门店最高奖50万，建立问题协调机制