美文网首页
Logstash重复消费Kafka的数据

Logstash重复消费Kafka的数据

作者: xueshengjian | 来源:发表于2017-10-12 13:01 被阅读0次

Logstash消费Kafka的数据,然后输出到Elasticsearch,某一天发现使用Kibana查询不到最近的数据。查看log后发现Kafka持续输出如下log:

Preparing to rebalance group xxx with old generation 1178 (__consumer_offsets-2)(kafka.coordinator.group.GroupCoordinator)

Stabilized group xxx generation 1179 (__consumer_offsets-2) (kafka.coordinator.group.GroupCoordinator)

Assignment received from leader for group xxx for generation 1179 (kafka.coordinator.group.GroupCoordinator)

由此可以判断出Kafka在rebalance offset,Logstash并没有提交已消费的offset。进一步查看Elasticsearch储存的数据,有个index的数据量超出正常的十几倍,并且还在持续增长,从Kibana查询该index的数据,确实有大量重复。所以,Logstash在不断重复消费某个topic的数据。

那么原因是什么呢?

查找一系列资料后发现,Logstash消费一批数据时session timeout,导致offset没有提交给Kafka。解决方案是配置Logstash kafka input 的2个参数:max_poll_records 和 session_timeout_ms,增加 session timeout 或 降低 max poll records 或 二者都调整,让Logstash在允许的时间范围内把一批数据处理完。

相关文章

  • Logstash重复消费Kafka的数据

    Logstash消费Kafka的数据,然后输出到Elasticsearch,某一天发现使用Kibana查询不到最近...

  • logstash 重复消费kafka问题

    前两天业务方突然找到我说当天索引ES查询很慢,原来毫秒级的查询现在竟然要20s,让我处理下。我看了下索引大小,原来...

  • Kafka实际案例问题

    kafka consumer防止数据丢失 Kafka学习之怎么保证不丢,不重复消费数据 1 消费者pull数据时,...

  • MQ随记(2)

    如何保证消息不会被重复消费(保证消息消费时的幂等性) kafka 按照数据进入kafka的顺序,kafka会给每条...

  • Kafka重复消费数据

    从消息发送和消息消费两个方面去说。 「ACK」 0:producer不等待broker的ack,这一操作提供了一个...

  • 腾讯云Logstash实战4-使用Logstash消费kafka

    Logstash的一个典型应用场景,就是消费kafka中的数据并且写入到Elasticsearch, 使用腾讯云L...

  • python3读写kafka

    消费kafka数据,方式一 消费kafka数据,方式二 将消息写入kafka

  • kafka之重复消费数据

    在进入主题之前,我们先思考一个问题。问题 kafka消费者使用自动提交的模式,提交间隔为2s,消费者在获取数据的时...

  • ELK相关文章索引(2)

    环境部署 logstash 插件安装 logstash将Kafka中的日志数据订阅到HDFS 基本常识 logst...

  • ES搜索条件不生效问题分析

    Logstash从kafka集群Topic获取数据,解析出其字段,然后写入到ES中,logstash.conf配置...

网友评论

      本文标题:Logstash重复消费Kafka的数据

      本文链接:https://www.haomeiwen.com/subject/hamnyxtx.html