因草原上的火山群而闻名的乌兰察布,最近正在成为科技公司们投资的重点。
凭借全国最优惠的电价,以及年均仅4.3℃的凉爽气候,位于内蒙的乌兰察布成为了国家“东数西算”工程八大算力枢纽节点之一。包括阿里巴巴、苹果在内的12大数据中心已落户乌兰察布。这里也因此被成为“草原云谷”。
8月2日,小鹏汽车宣布与阿里云共同在乌兰察布建成中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练。
小鹏汽车董事长、CEO何小鹏表示,随着自动驾驶模拟训练的需求变化,需要一个强大的本地+云端的算力来支持。“我们相信在2025年小鹏跟行业里面少数公司会开始将自动辅助驾驶的‘辅助’两个字去掉,在中国部分车会进入到真正的自动驾驶时代。”
算力大战一触即发
数据驱动是自动驾驶发展的公认方向,也让自动驾驶模型训练成为一头“吃算力”的巨兽。自动驾驶的视觉检测、轨迹预测与行车规划等算法模型,有赖于机器学习海量数据集,但算力的不足让研发速度仍远远赶不上数据量增长的速度。随着传感器的进一步增加,算力的挑战越来越大。
巨大的算力需求,对于车企来说,也是不小的负担。
何小鹏判断,“小鹏在算力方面的投入,每一年年度费用可能从2025年开始要超过10个亿,如何把算力不断提高,如何把成本不断控好,如何把相关的技术铺垫做好。”这对所有在智能化方面有追求的车企来说,都是不小的挑战。
小鹏汽车的选择,是与阿里云合作,共同建设一个大算力的智算中心。
何小鹏说,“有很多人在内部讨论,是不是需要一个自建的云端算力,还是一个合作的云端算力。我们相信跟阿里云一起能够更快更好更强的发挥作用。阿里云的技术支持,使我们的成本降低,以及过去的时间里,阿里云的可靠性和稳定性,都是小鹏汽车最好的选择。”
扶摇智算有何不同?
近年来,专用于机器学习的AI智算成为发展最快的一种算力形式。包括谷歌、微软、Meta、阿里巴巴在内的顶尖科技公司都纷纷建造了智算中心。
小鹏汽车基于阿里云打造的“扶摇”智算中心,算力规模达600PFLOPS,每秒可以完成(6*10的17次方次)浮点运算。这也是汽车行业中国最大的自动驾驶智算中心。
通过与阿里云合作,“扶摇”以更低成本实现了更强算力。首先,对GPU资源进行细粒度切分、调度,将GPU资源虚拟化利用率提高3倍,支持更多人同时在线开发,效率提升十倍以上。在通讯层面,端对端通信延迟降低80%至2微秒。整体计算效率上,实现了算力的线性扩展。存储吞吐比业界20GB/s的普遍水准提升了40倍。数据传输能力相当于从送快递的微型面包车,换成了20多米长的40吨集装箱重卡。
此外,阿里云机器学习平台PAI提供了模型训练部署、推理优化等AI工程化工具。
同时,扶摇”也是更绿色低碳的智算中心,采用风冷、AI调温、模块化设计等绿色技术,年平均能耗电力电源使用效率低于1.2。
这样的一个智算中心到底能为小鹏汽车带来哪些好处呢?
城市NGP研发加速
“扶摇”带来的最直接效果,是大幅提升自动驾驶模型训练的速度。
以小鹏的一个核心模型为例,过去需要7天才能完成一次训练,但算力规模达600PFLOPS的“扶摇”可以让训练时间缩短至不到1小时,提速了近170倍。
模型训练速度的大幅提升,可以让模型的成熟度更快提升,自动驾驶的智能化程度和安全性都进入新的阶段。目前,“扶摇”正用于小鹏城市NGP辅助驾驶系统的算法模型训练。
目前,小鹏希望今年下半年,能够第一个实现城市NGP辅助驾驶系统的量产落地。这是小鹏实现全场景智能辅助驾驶目标的重要一步。
何小鹏希望,在2022-2025年之间,小鹏汽车能够实现从小区到办公室的全场景智能辅助驾驶。
“扶摇”智算中心,相比于大多数车企的数据中心以数据大量存储内部使用为主,更强调从数据到深度学习的全闭环。“只有进行全闭环,你的云端能力,本地端能力,工具端能力,算力效率才能拉起来。”何小鹏说到。
阿里云智能解决方案销售部总经理霍嘉表示:“智算中心一直致力于三件事,一是算力足够大,二是算得要足够快,三是要提供足够绿色的算力。”
未来,小鹏和阿里云都将持续对“扶摇”进行投资,并逐步迭代。据悉,阿里云将继续在乌兰察布投资100亿元。
车云小结
算力已经成为数字经济时代的核心生产力,数据也已经成为了第一生产要素。
面对城区智能辅助驾驶即将落地,以及未来自动驾驶的实现,还有机器人发展带来的更大挑战。算力已经成了汽车企业的兵家必争之地。
除了在车端配备足够高的算力之外,小鹏“扶摇”智算中心的发布,也说明,小鹏在云端算力方面做好了准备。
面对数字时代的基础设施,云上竞争力将成为更多车企下一步的竞争高地。