蔡超

Mobvista. 副总裁兼首席工程架构师

2020.10.09

案例介绍—数字联盟DSP项目通过SpotMax服务高效降低云成本达65%

SpotMax是汇量科技旗下自研的大型弹性集群管理平台,旨在充分发挥阿里云抢占式实例价格优势的同时,智能化维护并保证集群稳定,帮助更多企业轻松享受更高性价比的优质云服务。数字联盟是最早尝试使用SpotMax的企业之一,让我们来看看数字联盟如何利用SpotMax服务最大化降低企业用云成本。




关于数字联盟

北京数字联盟网络科技有限公司(以下简称数字联盟),成立于2014年5月9日,是一家拥有独立知识产权、专注于移动互联网的数据服务提供商。


数字联盟旗下主推产品为自研的“可信ID”,专注于为APP开发者提供设备真实性和唯一性的甄别服务,解决APP推广过程中的数据不透明问题。目前,合作客户包括知乎、链家、苏宁、瑞幸咖啡、网易、途牛、新浪微博、百合网、去哪儿、Airbnb等知名移动应用。截止2020年6月底,“可信ID”已覆盖安卓去重设备9.47亿台,覆盖同期安卓设备超过95%,监测推广渠道2,400余家,覆盖国内推广渠道99%以上。


此外,数字联盟旗下拥有DSP(Demand-side Platform,需求方平台)产品,为广告主提供高效的程序化广告精准投放服务。该产品自2018年推出以来,已对接了10家广告交易平台(Ad Exchange),流量覆盖全国各个地区,日均广告请求量达到120亿次,实现日均10亿次广告展示量。



背景与挑战

数字联盟DSP每天需要高效处理来自各大Ad Exchange的广告请求,帮助广告主分析和定向受众,并以合理的竞价实现精准的程序化广告投放。目前,数字联盟DSP的日均广告请求量达到120亿次,最高峰值可达到200亿次,并且仍在快速增长中。而为了更好地适应快速的业务增长规模和需求,数字联盟依托阿里云服务进行DSP业务的云资源开发和部署。


在这个过程中,数字联盟DSP遇到的主要问题在于每天不同流量规模情况下的IT资源利用不均衡问题。一般来说,行业内DSP业务都存在流量规模的高低峰时段,而数字联盟DSP每天高峰和低谷的广告请求量相差较大,可达数倍。当广告请求量处于低谷时,IT设备资源得不到充分利用,就造成不必要的资源浪费;当广告请求量增长时,则会出现IT设备资源不足,而增加设备资源的速度不够及时,则导致广告流量的处理能力跟不上。


此外,随着业务规模的不断增长,尤其是在流量高峰时需要处理急剧上升的数据量,不仅IT设备规模不断上升,而且也对系统能快速处理和具备良好的可扩展性、稳定性提出了更高的要求。


因此,数字联盟需要一套综合性的解决方案,来适应业务运行过程中广告流量动态变化而自动增加或减少设备资源的能力,既能确保流量的处理能力和业务的稳定运行,同时又能提升资源的利用效率,降低使用成本。


解决方案

SpotMax通过分析数字联盟DSP现有架构,发现其存在的主要问题,包括采用大机型为主的实例和固定数量机器进行线上服务,这种情况容易造成使用成本偏高、优化空间小、且不利于后续采用弹性资源的稳定运行。


因此,SpotMax主要从两个方面对现有架构进行优化:


1. 使用抢占式实例来取代包年包月固定机器,达到实例成本的缩减,并使用SpotMax自研的MaxGroup服务来确保使用抢占式实例时不影响业务的稳定运行;


2. 采用弹性云计算方案,针对每天线上业务的数据量负载情况,实现云端资源的动态分配和管理,并完善运维架构以实现精准的自动化监控及报警,从而达到从整体上最大化降低成本的目标。



价值与结果

通过以上方案,SpotMax以更少的云端资源、更灵活的镜像管理、更符合阿里云特性的弹性云架构,不仅解决了数字联盟DSP此前存在的“无弹性工作方式”所造成的资源浪费问题,而且保障了其线上服务在改造过程中不受影响的稳定运行,从而实现了云资源成本的大幅降低。


数字联盟的技术总监邓为强表示,“通过与SpotMax合作,数字联盟DSP当前成本降低了65%。基于云平台的架构方案使得后续DSP业务能有更良好的伸缩空间,不会被成本所掣肘,对后续DSP业务及大数据的规模化建设建立了良好的基础。”


此外,SpotMax团队提供了全程的跟进服务,不断完善该套云资源优化解决方案。


“在这个过程中,SpotMax强大的技术团队不仅为我们设计了符合我们业务的优化方案,而且还会按照详细的流程进行实时跟进,在合作中对遇到的问题都能够积极组织人员进行探讨和解决,最终提前并超额完成预定目标,是一个值得信赖的合作伙伴。” 邓为强补充到。



返回博客主页