考拉上“云”的431天:经历了怎样的“脱胎换骨”?
“当时非常紧张,迁移的操作列表,每一个都非常长,每一个操作步骤后的验证步骤也非常长,需要很多同学配合做出精细化操作。一旦切到阿里云时出现差池,会对用户体验产生直接影响,我们的目标就是零故障,因此必须非常谨慎。”考拉测试质量团队负责人林兮说。 办公室里,伏见盯着大屏上的进度条一点点向前挪动,就像瞭望着一艘夜航巨轮,正在航道灯的引导下驶过暗礁险滩。 “其实演练过很多次,基本上不会出现问题。”伏见相信。3月1日凌晨3点40多分,进度条顺利走完,数据迁移大功告成。
全站切换至阿里云后,考拉立刻进入验证阶段,一有问题,工程师们迅速跟进解决,1日当天,成功闭环98%以上的问题。 “那天,这个数据在群里同步时,大家都很嗨,这可以算是一次‘零故障’迁移了。”林兮说。 数据搬完家后,考拉立刻开始备战3.8女神节大促,迎接考拉迁移上云后的首个流量洪峰。
经过连续几天的压测和紧急扩容,3.8女神节当天,考拉的流量峰值,较2019年双12增长了72%,而运行在云上的考拉如磐石般稳稳地扛住了流量峰值,而且成本比之前大幅度降低。 考拉各业务线也在当天被证明已100%打通,形成闭环。 直到大促结束,吴明团队没有接到伏见的紧急电话,没有消息,就是最好的消息。 每年节省2000万元成本 3月31日,考拉如期从网易机房下线,铺设在网易和阿里之间的5公里光纤专线,在完成历史使命后也顺利拆除。 至此,考拉全面上云、快速入园的任务,获得了里程碑式的成功。 圆满完成第一阶段目标后,考拉开始了全面的云原生之路。 过去,每到大促前夕,考拉都要提前几个月打申请,临时购买服务器扩容。 如今,借助阿里云的弹性计算,考拉可实现单日内的弹性收缩。 还有同城双活数据中心,考拉过去一直想做。 在同个城市部署两个数据中心的好处在于,可以在一个数据中心发生故障或灾难的情况下,实现用户的“故障无感知”。 考拉曾在2019年做过一套方案,发现建设这个能力需要8个月,成本高达上千万元。 (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |