加入收藏 | 设为首页 | 会员中心 | 我要投稿西安站长网（https://www.029zz.com.cn/）- 科技、建站、经验、云计算、5G、大数据,站长网!

当前位置：首页 > 建站 > 正文

粉丝关系链，10亿数据，如何设计？

发布时间：2019-08-20 22:37:18 所属栏目：建站来源：58沈剑

导读：副标题#e# 继续答星球水友提问，大数据量，高并发量，好友关系链、粉丝关系链要如何设计? 什么是关系链业务? 关系链主要分为两类，弱好友关系与强好友关系，两类都有典型的互联网产品应用。弱好友关系的建立，不需要双方彼此同意：用户A关注用户B，不需要

从上面的讨论可以看到，不管哪种方案，因为两步操作不能保证原子性，总有出现数据不一致的可能，高吞吐分布式事务是业内尚未解决的难题，此时的架构优化方向：最终一致性。并不是完全保证数据的实时一致，而是尽早的发现不一致，并修复不一致。最终一致性，是高吞吐互联网业务一致性的常用实践。更具体的，保证数据最终一致性的常见方案有三种。

方法一：线下扫面正反冗余表全部数据

粉丝关系链，10亿数据，如何设计？

如上图所示，线下启动一个离线的扫描工具，不停的比对正表T1和反表T2，如果发现数据不一致，就进行补偿修复。

优点：

比较简单，开发代价小
线上服务无需修改，修复工具与线上服务解耦

缺点：

扫描效率低，会扫描大量的“已经能够保证一致”的数据
由于扫描的数据量大，扫描一轮的时间比较长，即数据如果不一致，不一致的时间窗口比较长

有没有只扫描“可能存在不一致可能性”的数据，而不是每次扫描全部数据，以提高效率的优化方法呢?

方法二：线下扫描增量数据

粉丝关系链，10亿数据，如何设计？

每次只扫描增量的日志数据，就能够极大提高效率，缩短数据不一致的时间窗口，如上图1-4流程所示：

写入正表T1
第一步成功后，写入日志log1
写入反表T2
第二步成功后，写入日志log2

当然，我们还是需要一个离线的扫描工具，不停的比对日志log1和日志log2，如果发现数据不一致，就进行补偿修复

优点：

虽比方法一复杂，但仍然是比较简单的
数据扫描效率高，只扫描增量数据

缺点：

线上服务略有修改(代价不高，多写了2条日志)
虽然比方法一更实时，但时效性还是不高，不一致窗口取决于扫描的周期

有没有实时检测一致性并进行修复的方法呢?

方法三：实时线上“消息对”检测

粉丝关系链，10亿数据，如何设计？

这次不是写日志了，而是向消息总线发送消息，如上图1-4流程所示：

写入正表T1
第一步成功后，发送消息msg1
写入反表T2
第二步成功后，发送消息msg2

（编辑：西安站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

4

相关内容

推荐文章

怎么建设成功的网站怎么做网页来教你

怎么建设成功的网站怎

站长推荐

热点阅读