MQ随记（2）

作者: 喧嚣城外 | 来源:发表于2019-02-14 16:08 被阅读0次

MQ随记（2）
MQ随记（1）
RocketMQ（一）初识RocketMQ
docker 使用rabitmq
《吃透 MQ 系列1》之核心基础篇
《吃透 MQ 系列3》之 Kafka 架构设计的任督二脉
《吃透 MQ 系列4》之 Kafka 存储选型的奥秘
《吃透 MQ 系列5》Kafka 精妙的高性能设计（上篇）
《吃透 MQ 系列6》Kafka 精妙的高性能设计（下篇）
《吃透 MQ 系列2》之扒开 Kafka 的神秘面纱

如何保证消息不会被重复消费（保证消息消费时的幂等性）

kafka

按照数据进入kafka的顺序，kafka会给每条数据分配一个offset代表这个数据代号
消费者会提交offset，告诉kafka已消费到多少offset条数据。
zk记录消费者当前消费到多少offset条消息。

遇到的坑：
消费者不是消费完就提交offset的，而是定时定期提交。
消费者如果在准备提交offset时，但是还未提交，消费者被重启了，那么此时消费过的数据offset还没有提交，kafka也就不知道已经消费了哪些条消息，一旦消费者启动，就会重复消费。

幂等性：通俗的讲，就是一个数据或者一个请求，重复几次，确保对应数据不回改变，不能出错。

保证幂等性结合业务来思考，以下是几个思路：

比如消费到数据用来写库，先查询，如果有了就不插入，update一下。
比如redis，没问题了，每次都set，天然幂等性。
使用唯一键，重复插入报错。

如何确保消息可靠性传输（如何处理消息丢失问题）？

rabbitmq

1.写消息过程，消息都没到rabbitmq在网络传输过程中就丢失了，或者消息到了rabbitmq，但是内部出现错误没有保存下来。
2.rabbitmq接收到消息后先暂时存在内存中，结果消息还没有被消费，rabbitmq自己挂掉了，导致内存中的消息搞丢。
3.消费者消费到这个消息，还没有来得及处理，自己挂掉了，但是rabbitmq以为这个消息已经被消费掉了。

解决写消息丢失：

把channel设置为confirm模式。
发送一个消息。
发送完消息就不管了。
rabbitmq如果接收了这条消息，就回调生产者本地的接口
如果接收失败，回调生产者本地的失败接口

channel.confirm;
//发送消息
//回调接口
public void ack(String message){
}
public void nack(String massage){
    //重新发送
}

rabbitmq生产者这块如果要保证消息不丢失，一般是用connfirm机制，异步的模式，你发送消息后不回阻塞，直接发下一个，吞吐量高一些。

解决mq自身丢失问题：
开启消息持久化。

解决消费者丢失问题：
关闭autoAck机制，每次自己确定处理完再发送ack给rabbitmq。

kafka

消费端弄丢数据：
唯一可能导致消费者弄丢数据的情况，也就是说，你那个消费到了这个消息，然后消费者那边自动提交了offset，让kafka以为已经消费好了这个消息，但是在准备处理时，消费端挂了，此时消息丢失。
解决方法：kafka会自动提交offset，那么只要关闭自动提交offset，在处理完后自己手动提交offset，就可以保证数据不丢失，但是此时还是会遇到重复消费问题，自己保证幂等性即可。

kafka弄丢了数据：
kafka某个broker宕机，然后重新选举出来的partiton的leader时。如果此时其他follower刚好还有些数据没有同步，结果此时leader挂了，然后选举出某个follower成了leader，就造成数据丢失。
所以此时一般要求设置一下 4个参数。

给这个topic设置replication.factor参数：这个值必须大于1，要求每个partition必须有至少两个副本。
在kafka服务端设置min.insync.replicas参数：这个值必须大于1，这个是要求一个leader至少感知一到一个follower还跟自己保持联系，没有掉队。才能确保leader挂了还有一个follower吧。
在producer端设置acks=all：这个要求每条数据，必须写入所有replica之后才能认为写成功。
在producer端设置retries=MAX(很大很大的值，无限重试的意思)
这样配置后，至少可以在kafka broker端保证leader所在broker发生故障，进行leader切换时，数据不回丢失。

生产者会不会丢失数据：
如果按上述思路配置ack=all，一定不会丢失，因为leader接收到消息，所有follower都同步到了消息之后，才认为本次写入成功，如果没有满足这个条件，生产者会自动不断重试，重试无限次。

如何保证消息消费顺序正确

rabbitmq如何保证

给每个消费者开一个queue

图片02.png

kafka如何保证

写入一个partition是有顺序的，生产者在写时，可以指定一个key，比如说指定某个订单id作为key，这个订单相关数据一定会被分发到一个partition中去。
partition只能被一个消费者消费。
可确保消费者以顺序取出。
但是可能会出现问题：
消费者内部多线程，消费者内部可能造成顺序不一致。

图片02.png

如何解决消息队列的延时以及过期失效时间？消息队列满了以后怎么处理？有几百万消息持续积压了几个小时，怎么解决？

如果消息积压了几百万或者上千万数据，及时消费者恢复了，也需要大概1小时时间才可以恢复过来。

一般这个时候就需要紧急扩容了，具体操作及思路如下：

先修复consumer的问题，确保恢复消费速度，然后将consumer都停掉
新建一个topic，partition是原来的10倍，临时建好原先10倍或者20倍的queue数量
然后写一个临时的分发数据的consumer程序，这个程序部署上去消息积压的数据，消息之后不做耗时处理，直接均匀轮询的写入临时建好的10倍数量的queue
接着临时征用10倍的机器来部署consumer,每一批consumer消费一个临时queue的数据。
这种做法相当于是临时将queue资源和consumer资源扩大10倍，以正常的10倍速度消费。
等快速消费完积压数据后，得恢复原先部署架构，重新用原先的consumer机器来消费消息。

第二个坑（设置消息过期时间）

等过了高峰期后，这个时候开始写程序，将丢失的那批数据，写一个临时程序，一点点查出来，然后重新灌入mq里，进行补偿。

第三个坑（mq快满了）

如果走的方式是消息积压在mq里，那么如果你很长时间都没有处理掉，此时导致mq都快写满了，临时写程序，消费一个丢弃一个，尽快消费掉所有消息，然后写程序进行补偿。

如何设计一个消息队列的架构

首先这个mq得支持可伸缩性，需要时可快速扩容，就可以增加吞吐量和容量。参照kafka的设计理念，broker->topic->partition，每个partition放一个机器，就存一部分数据。如果资源不够，给topic增加partition，然后数据迁移，增加机器。
其次考虑mq数据落地磁盘，才能保证数据不会丢失，顺序写，这样就没有磁盘随机读写的寻址开销，磁盘顺序读写性能是很高的，kafka思路。
考虑mq可用性。参考kafka高可用保障机制。多副本->leader&follower->broker挂了重新选举leader即可对外服务。
能不能支持数据0丢失，参考kafka数据零丢失方案。

网友评论

本文标题：MQ随记（2）

本文链接：https://www.haomeiwen.com/subject/jdveeqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

MQ随记（2）

如何保证消息不会被重复消费（保证消息消费时的幂等性）

kafka

幂等性：通俗的讲，就是一个数据或者一个请求，重复几次，确保对应数据不回改变，不能出错。

如何确保消息可靠性传输（如何处理消息丢失问题）？

rabbitmq

kafka

如何保证消息消费顺序正确

rabbitmq如何保证

kafka如何保证

如何解决消息队列的延时以及过期失效时间？消息队列满了以后怎么处理？有几百万消息持续积压了几个小时，怎么解决？

如果消息积压了几百万或者上千万数据，及时消费者恢复了，也需要大概1小时时间才可以恢复过来。

第二个坑（设置消息过期时间）

第三个坑（mq快满了）

如何设计一个消息队列的架构

相关文章

MQ随记（2）

MQ随记（1）

RocketMQ（一）初识RocketMQ

docker 使用rabitmq

《吃透 MQ 系列1》之核心基础篇

《吃透 MQ 系列3》之 Kafka 架构设计的任督二脉

《吃透 MQ 系列4》之 Kafka 存储选型的奥秘

《吃透 MQ 系列5》Kafka 精妙的高性能设计（上篇）

《吃透 MQ 系列6》Kafka 精妙的高性能设计（下篇）

《吃透 MQ 系列2》之扒开 Kafka 的神秘面纱

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读