首个100%的云上双11 “平头哥”自研AI芯片成为主力


“今年天猫双11是首个100%的云上双11,成功扛住了全球规模最大的流量洪峰。”11月11日,阿里巴巴首席技术官程立表示,经过历年双11的“大考”,阿里技术实现了多级跳跃。目前,阿里巴巴业务已全部跑在阿里云上。
程立介绍,通过统一的资源池调度以及支撑大规模的离在线混部,阿里云已能实现在线业务优先调度,应对脉冲式的流量冲击,交易链路大幅优化。由此,阿里巴巴业务的研发效率提升20%、CPU资源利用率提升30%、应用100%云原生化、在线业务容器可达百万规模,计算效率大幅提升。
要把阿里巴巴的海量业务全部迁上公共云,不光是规模难题,还要在“搬迁”过程中保证业务不中断,应对期间可能出现的突发状况。今年年初,阿里巴巴把最繁重的一个业务——搜索业务顺利搬到了云上,而消费者和商家对这个“开着飞机换引擎”的过程毫无感知。

值得一提的是,今年双11期间,“平头哥”自研AI芯片含光800作为搜索推荐等场景算力的主力,支持全球规模最大的电商搜索任务,这意味着含光800已进入规模化应用阶段。
据介绍,2021双11期间,含光800通过阿里云平台支持了淘宝搜索、推荐等业务,其中淘宝主搜100%的AI算力由该芯片提供。实际应用情况显示,含光800有效发挥了芯片与云计算环境融合的优势,既提升了系统的性能又降低了整体能耗,以搜索场景为例,相比传统GPU,使用含光800运行的算法效率最高可提升近2倍,单位算力能耗降低58%。
2019年云栖大会上,含光800亮相。采用平头哥自研架构,这颗芯片通过软硬件的协同设计实现性能突破,对卷积神经网络类算法进行了高度优化,在当时创造了性能和能效比两项纪录,适用于图像搜索、场景识别、视频内容识别、自然语言处理等场景。2020年6月,阿里云正式发布搭载含光800推理芯片的云服务,目前已服务搜索推荐、视频直播等行业客户。
从2014年采用自研数据库承载交易系统、2015年实现全球最大规模的混合云架构、2019年核心交易系统上云、再到今年全栈自研技术支持双11,包括自研芯片和服务器投入超大规模实战、数百台小蛮驴物流机器人全国配送等,双11不光是内需市场潜力的见证窗口,更持续释放着技术升级的红利。

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。‍
到顶部