当前位置: 首页 > news >正文

Kafka 核心使用机制总结

Kafka 核心使用机制总结

  • Kafka 核心使用机制总结
    • 1. 分区 (Partitions) - 实现伸缩性与并行处理
    • 2. 副本 (Replicas) / 复制因子 (Replication Factor) - 实现高可用与容错
    • 3. 消费者组 (Consumer Groups) - 控制消息分发与消费进度
    • 4. 数据保留策略 (Retention Policies) - 管理存储空间
    • 5. Kafka 功能测试示例 (`test-topic`)

Kafka 核心使用机制总结

1. 分区 (Partitions) - 实现伸缩性与并行处理

  • 概念: 一个 Kafka 主题 (Topic) 可以被划分为一个或多个分区。每个分区是一个独立的、有序的日志流。
  • 目的: 主要为了提高 Kafka 的伸缩性 (Scalability)吞吐量 (Throughput)
    • 并行写入: 生产者可以同时向不同分区发送消息。
    • 并行消费: 一个消费者组内的多个消费者实例可以同时从不同的分区读取消息。
  • 我们设置了 3 个分区: 对于 test-topic(下文测试示例),设置 3 个分区允许最多 3 个属于同一个消费者组的消费者实例并行工作,每个实例负责一个分区。
  • 顺序保证: Kafka 只保证在一个分区内部的消息是严格有序的。不同分区之间的消息顺序不保证。
  • 注意: 一条消息只会属于一个分区。

2. 副本 (Replicas) / 复制因子 (Replication Factor) - 实现高可用与容错

  • 概念: 为了数据冗余和故障恢复,每个分区可以有多个副本,这些副本必须分布在不同的 Broker 节点上。
  • 复制因子: 指每个分区总共的副本数量(1 个 Leader + N 个 Follower)。
  • Leader 与 Follower: 每个分区有且仅有一个 Leader 副本负责处理所有读写请求,其他 Follower 副本从 Leader 同步数据。
  • 高可用性: 如果持有 Leader 副本的 Broker 宕机,Kafka 会自动从同步的 Follower 中选举出新的 Leader,确保服务几乎不中断且数据不丢失。
  • 我们设置了 3 个副本 (复制因子=3): 在 3 节点的 Kafka 集群中,设置复制因子为 3 是最高容错配置。test-topic

相关文章:

  • ADW600防护等级与电气安全设计要点详解
  • MCU开发学习记录11 - ADC学习与实践(HAL库) - 单通道ADC采集、多通道ADC采集、定时器触发连续ADC采集 - STM32CubeMX
  • 从零到精通:探索GoFrame框架中gcron的定时任务之道 —— 优势、实践与踩坑经验
  • Java的JUC详细全解
  • Kotlin高阶函数 vs Lambda表达式:关键区别与协作关系
  • 深度探究获取淘宝商品数据的途径|API接口|批量自动化采集商品数据
  • 小学数学出题器:自动化作业生成
  • 智能指针(weak_ptr )之三
  • equals与hashCode的关系探究
  • 一 、环境的安装 Anaconda + Pycharm + PaddlePaddle
  • 火山云生态的体现
  • 容器内部无法访问宿主机服务的原因及解决方法
  • 深入解析:RocketMQ、RabbitMQ和Kafka的区别与使用场景
  • MySQL的日志--Redo Log【学习笔记】
  • opencv--图像
  • Synternet数据流正式上线Google Cloud Web3
  • Vue3 模板语法
  • AIGC架构与原理
  • gem5教程第四章 了解gem5统计和输出
  • Spring Cloud Eureka 与 Nacos 深度解析:从架构到对比
  • 山西国道塌方致55岁货车司机死亡,女儿:货车的车贷还要还
  • 明日出征!航天员详细信息来啦
  • “中华优秀科普图书榜”2024年度榜单揭晓
  • “沉默”的智驾:余承东不喊“遥遥领先”,何小鹏连夜改口 | 电厂
  • 直播中抢镜“甲亢哥”的翁东华卸任!此前任文和友小龙虾公司董事
  • 上海优化餐企发展环境:装修拓展门店最高奖50万,建立问题协调机制