网易严选案例|下单峰值增长10倍,毫秒级处理,轻舟助力练就电商必杀技

最近,网易严选一系列动作给人留下深刻印象。4周年庆刚刚结束,期间狂派4亿消费券,一口气上线600多款品质新品,更上了老罗的直播首秀带货。

而在更早的春节期间,网易严选除了迅速联动供应商,加量防疫物资生产,还在第一时间上线防疫用品的免费领取频道,成为这场疫情防疫中最早支援的电商平台,累计帮助用户20余万人。3月,网易严选上线小微企业口罩政府保供通道,每天开放20万只口罩申购,帮助企业复工复产。


这些既要求网易严选保持电商行业促销多、活动丰富的自有快节奏,又要在突发事件中快速反应。这是如何做到的呢?

网易严选痛点&需求:

1.促销频率提升,大型促销流量加大,对系统整体稳定性、扩缩容速度要求更高

2.电商业务变化快,需求丰富,版本迭代加速,对研发效率要求更高

3.专场秒杀、抢购等活动增加,活动期间如果系统出现问题,且未能快速定位和解决,很可能影响活动效果


 一、电商人又爱又恨的促销中,如何稳定应对流量大军?

有相关统计,电商企业一年约有86 次大大小小的促销。拿网易严选来说,几场大促,例如4.11周年庆、双11大促、黑五大促等都是重要时刻。而对技术团队来说,最重要的就是稳稳稳稳稳+扩容扩容扩容扩容扩容了。

为了保障这些活动时系统的稳定性,应对流量大军,网易严选借助轻舟微服务,提前做了这三件事:

○ 引入轻舟容器云,实现业务微服务部署、调度、扩缩容等容器化能力,所有业务服务具备健康检查、宕机拉起等高可用能力,业务在大促等大流量场景下即使部分异常,也可以及时监测并快速拉起,整体稳定性提升明显。而在此前,业务基于虚拟机方式部署与运维,缺乏动态扩缩容、调度、部署能力。

○ 引入轻舟中间件Kafka,实现容器化分布式消息中间件。从以前用物理机部署分布式消息中间件套件,需要手动运维半小时进行扩容,加速到只需要几分钟。同时具备动态扩缩容能力和一定自动运维能力。

○ 借助轻舟中间件RocketMQ,实现容器化分布式消息中间件,一键快速部署RocketMQ的套件,扩容从手动运维变成自动运维,时间加速到几分钟,并具备主从切换,故障恢复的自运维能力。此外,提供统一队列控制台,规范接入管理和使用。

以2019年双11为例。那天,网易严选的下单峰值同比增长10倍,仍实现毫秒级处理。活动的第一个小时,下单总量同比增长215%,借助轻舟微服务基于Kubernetes构建的弹性伸缩能力,网易严选顺利扛住流量大军,保障服务质量。

不只助力完成大促任务,这对资源、成本的优化利用也是显而易见的。大促前后,机器调度比较多,通过容器扩缩容能力,网易严选快速对资源上下线,也可以快速回收资源,极大提升资源利用率,节省近 50%的资源成本。

同时,容器支持共享部署模式,在性能不变的情况下,相比物理机部署资源使用率提高20%。通过容器化的分布式消息中间件,只需要修改配置就实现扩容,比起用物理机方式手动操作,这大大降低了运维成本及复杂度。

二、适应电商运营迭代加速趋势,业务交付提升5倍

几天上线一个新产品、几周一个升级版,对4岁的网易严选已经不是新鲜事。版本更新、活动迭代日趋加速,对研发交付的要求也急剧提升。在这一点上,网易严选也通过轻舟微服务早早做了部署:

○ 轻舟基于容器云和CodePipeline为网易严选提供DevOps解决方案,采用容器化部署方式,构建高效、持续的软件研发流水线,业务交付效率提升5倍,大大适应了运营活动中高速迭代的需求。

○ 同时,通过对服务进行拆分,并通过无侵入的轻舟服务网格,拉齐不同语言栈的服务治理能力,真正实现业务与基础设施的高度解耦,使得网易严选可以在异构技术栈下低成本、大幅度地提升业务迭代效率。

三、 故障定位速度快上加快,保障服务可用,为买买买保驾护航 

除了新产品、大促,网易严选的各类精选专场、捡漏、限时购、会员福利,也一直在圈粉。如果没有有效的故障定位和解决机制,一旦出现问题,会让使用体验大打折扣。在这点上,自然不能打无准备之仗:

○ 采用轻舟分布式链路追踪平台,10分钟快速定位哪个服务存在问题,故障定位效率提升2倍以上。

○ 采用基于云原生方向的轻舟服务网格、API网关组件,通过限流、熔断等服务治理能力,即使个别页面出现问题,也不影响APP整体正常使用。依靠轻舟中间件的运维,简单故障可以自愈的同时保持业务连续性。

○ 引入轻舟中间件MySQL RDS,提供MySQL组复制集群完整的生命周期管理、自动的故障监测修复能力以及灵活的报警配置。同时还提供读写分离、横向的读扩展、数据定期备份以及多数据中心部署能力,最大限度保障服务可用性以及数据的安全性。

○ 引入轻舟中间件Redis,可以实现Redis集群全生命周期托管,实现创建、配置变更、版本更新、扩容缩容和异常自动恢复,提供灵活的报警配置。提供多数据中心支持和加速业务的访问速度,最大限度保障服务可用性。

网易严选中台负责人 王国云:网易严选作为一个现象级的品牌电商,诞生4年以来,通过技术的不断升级与创新,高效整合供应链,业务持续快速增长。

从19年开始,为了使我们的业务更敏捷、更高效、更稳定,网易严选全面拥抱云原生,依托网易轻舟微服务在容器化、DevOps和微服务领域多年的积累,平滑地完成了云化升级,全面提升了交付能力、运维诊断能力、服务治理能力及压测和故障演练能力。

来源:网易云  

相关阅读:

秒杀系统设计思路

不谈虚的,给传统企业一份代码级的中台落地实践