kafka课后总结
Kafka是由LinkedIn开发的分布式发布 - 订阅消息系统,具备高吞吐量、低延迟、可扩展性、持久性、可靠性、容错性和高并发等特性。其主要角色包括Broker、Topic、Partition、Producer、Consumer、Consumer Group、replica、leader、follower和controller。消息系统中存在点对点和发布订阅两种模式,Kafka在大数据流式处理场景优势明显。安装Kafka前需安装JDK和Zookeeper,安装时要注意版本选择,安装完成后需对配置文件进行修改和分发。启动Kafka集群前要先启动Zookeeper,还可配置环境变量实现一键启动和关闭
在命令行使用方面,Kafka提供了丰富的命令用于管理和操作。可创建、查看、删除topic,进行数据生产与消费。生产数据时指定broker和topic,消费数据时可从指定位置开始,还能指定groupid。