扣丁学堂简述2018大数据Kafka重置消费的Offset

2018-03-14 15:52:42 1222浏览

大数据Kafka重置消费的Offset有多少的小伙伴知道或者了解呢?别的不多说了,下面和扣丁学堂大数据培训的小编一块来了解一下大数据Kafka重置消费的Offset吧。



扣丁学堂简述2018大数据Kafka重置消费的Offset



Kafka 0.8以后提供了Coordinator的角色,Coordinator除了可以来协调消费的groupbalance外,还接受 OffsetCommit Request,用来存储消费的offsetKafka本身中,具体可参考Kafka的消息是如何被消费的。


Kafka 0.8以前的版本


绝大部分的offset应该都是写到zookeeper上,类似/consumers/[consumer group]/offsets/[topic]/[partition]


如果不想重启消费进程就能reset,可以在zk上创建一个新节点,专门用来记录需要resetoffset位軒,然后代码里watch这个节点,获取到需要重置到的offset值,然后在发送Fetch Request时使用这个新的offset值即可。


Kafka 0.10以后的版本


Kafka 引入了Timestamp,具体可参考Add a time based log index,这样就可以方便的根据时间来获取并回滚相应的消费啦,真是太方便了

不仅如此 Kafka还提供了专门的工具来作Offset rest,具体不累述,请参考Add Reset Consumer Group Offsets tooling


Kafka 0.9.0.1版本


这个版本你当然还是可以将offset保存在zk中,然后使用上面提到的方法重置。


我们现在重点来讨论下将offset保存到kafka系统本身的,其实就是存到一个内部的叫__consumer_offsets,具体可参考Kafka的消息是如何被消费的。



Kafka提供自动reset的配置


auto.offset.reset


1.1 smallest : 自动重置到最小的offset,这个最小的offset不一定是0,因为msg可能会被过期删除掉;


1.2 largest : 自动重置到最大的offset;


这个配置只有在当前无法获取到有效的offset时才生效;


2.1 全新的group;


2.2 已存在的group,但很久没有提交过offset,其保存在__consumer_offsets里的信息将被compact并最终清除掉;


需要手动reset时,并没有像Kafka 0.10(11)版本那样提供给我们工具,那怎么办? 只能自已搞,下面提供一个思路:


确定需要重置到的offset:


1.1 如果想重置到最新或最旧的offset,可能通过kafka的命令行工具获取:


kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list [broker list] --topic [topic name] --time [-1:获取最新offset, -2:获取最旧offset]


1.2 也可以通过代码来获取,可以使用librdkafkard_kafka_query_watermark_offsets函数来获取;


重置offset,以使用librdkafka提供的接口为例:


2.0 需要先停掉需重置的group的所有消费进程,可以使用rd_kafka_list_groups来获取当前消费 gropu的详情;


2.1 使用rd_kafka_topic_partition_list_set_offset来设置需要重置的partitonoffset;


2.2 调用rd_kafka_subscriberd_kafka_consumer_poll来等待group完成balance;


2.3 调用rd_kafka_commit来完成重置的offset的提交;


当然librdkafkakafka api都提供了seek接口,也可以用来设置offset;


如果不是想重置到最新或最旧的offset, 而是想重置到某一时间点的offset, 该怎么办?



这个版本不支持timestamp,如果不想对kafka源码作改动的话,可以定时获到group的消费offset,然后写入到外部存储系统, 比如redis;



需要重置时,从外部存储系统根据时间点来获到到当时的offset,由于是定时采样,不一定能完全匹配上指定的时间点,但可以取与其最接近的时间点。



好了,关于大数据Kafka重置消费的Offset就暂且为大家分享这些,喜欢大数据想要学习大数据的小伙伴可以选择口碑良好的扣丁学堂,扣丁学堂不仅有专业的老师和与时俱进的课程体系,还有大量的大数据视频教程供学员观看学习哦。扣丁学堂大数据学习群:209080834

关注微信公众号获取更多学习资料

关注微信公众号获取更多学习资料




查看更多关于大数据培训资讯的相关文章>>

标签: 扣丁学堂简述2018大数据Kafka重置消费的Offset 大数据培训 大数据视频教程 大数据分析师 大数据开发工程师

热门专区

暂无热门资讯

课程推荐

微信
微博
15311698296

全国免费咨询热线

邮箱:codingke@1000phone.com

官方群:148715490

北京千锋互联科技有限公司版权所有   北京市海淀区宝盛北里西区28号中关村智诚科创大厦4层
京ICP备12003911号-6   Copyright © 2013 - 2019

京公网安备 11010802030908号