《军武次位面》作者:军武菌
一场看不见硝烟的较量
1894年,大西洋两岸的竞争地位发生变化,美国工业总产值首次超过英国,成为全球制造业第一大国。
很难想象再向前倒推20年,美国的工业总产值还不到英国的一半,大西洋东岸还是全球毫无争议的霸主。改变这一切的力量源自于电,1879年,发明白炽灯的爱迪生创立“爱迪生电力照明公司”——这就是日后的GE通用电气公司,自此,人类进入了电气时代。
19世纪末,美国用一场世博会向全世界展示了电力的力量。在1893年5月1日的夜晚,芝加哥的夜空被电力照亮,灯光从金顶的行政大楼绵延至建筑群,比艾佛尔铁塔更高的摩天轮闪烁着转动,彩灯映射下,广场上的喷泉流光溢彩。
马车变成电车,电报和电话取代信件;社会形态被电力改变,高楼拔地而起,现代化城市出现,大型企业组织诞生。
二次工业革命临近末尾时,美国坐稳了工业总产值的冠军之位,超过英、法、德、日本总和。
每一次工业革命的背后都是动力的革命,同样,每次革命的背后也都牵动着大国间的国力竞争。英国用蒸汽发动了第一次工业革命,盘踞世界霸主之位达一个世纪之久;美国用电力推动第二次工业革命,奠定以电力为核心的技术体系,反超英国及欧洲,至今领跑全球。
赢得下一场动力之争,就能取得先机。
美国深知这点,二战期间,美国率先研发出全球第一台通用计算机ENIAC,虽然没赶上二战中的导弹弹道计算,但当时的资料显示,ENIAC投入氢弹研发工作后,让氢弹的模拟计算耗时从40小时缩短到了20秒。
上世纪六七十年代,全球各国陆续开始投入算力建设,1965年,戈登·摩尔提出了摩尔定律,1968年英特尔成立,1969年AMD成立,现在能看到的算力巨头,在当时已经是群雄逐鹿。日本的索尼、松下、东芝,欧洲的西门子也开始在70年代发力。
中国开始研制第一台大型通用计算机,根据苏联提供的M-3小型机技术,1958年,中国科学院计算技术研究所和北京有线电厂研制出我国第一架通用数字电子计算机“103型机”。次年,升级版的“104型机”诞生,运算速度提升到每秒1万次。
世界进入一场算力赛跑——在摩尔定律推动下,算力以每18个月计算性能增加一倍的速度在快速前进。
我们可以看到,在算力竞赛的上半场,中国明显落后于西方国家。104型计算机诞生时只生产了两台,一台提供给搞原子弹的二机部,一台提供给造火箭的七机部,然后其他人使用手摇计算机和算盘做辅助。
但在计算机诞生半个世纪之后,竞赛局面正在发生变化。
受到物理世界限制,摩尔定律有自己的极限,这在最近二十年变得越来越明显,单台机器的硬件性能不可能无限翻倍;另一方面,从互联网、移动互联网到数字经济,算力需求增速却是越来越快,尤其是人工智能兴起后,AI计算量几乎以每年10倍的速度增长。
供需的矛盾把算力竞争带到了下半场,为了让“有限的物理资源”满足“无限的算力需求”,算力竞赛从单纯的拼硬件,变成了拼系统和效率。
这就像从白炽灯到节能灯,原本白炽灯用60瓦能达到的亮度,节能灯仅用3瓦、5瓦的功率就能达到——算力每秒的计算次数不变,但效率提升后,能完成实现的工作成倍、乃至数百倍提升。
2020年,美国企业OpenAI开发出AI大模型GPT-3,将这款能写字、能说话、能看图和视频、又能听懂语音的“多模态”大模型训练至1750亿参数,消耗算力相当于一辆车开70万里。但在两年后,阿里训练出全球最大的10万亿参数预训练大模型M6时,通过对算力系统和算法框架优化,所用能耗仅为GPT-3的1%。
在人类的科技史上,找准方向比拼命奔跑更关键。
爱迪生发明了白炽灯和直流电,但是让芝加哥世博会照亮世界的灯光,却来自于他的对头——尼古拉·特斯拉力推的交流电。特斯拉推广交流电的时间虽然比爱迪生迟了十余年,但交流电却建立了全新的电力系统,成为全球的电力标准。
下半场打响,意味着算力竞争进入了一次重新洗牌,将全球算力技术重新拉到同一个起跑线。这里不一样的是,中国不再像上一次那样晚起步了十几年,而是经过信息和网络时代的积累,站在了相当前沿的位置上。
《全球计算力指数评估报告》显示,全球算力排名美国和中国分列前两位,同处于领跑者的位置,而在代表先进产业的AI算力上,中国以AI服务器指出规模同比增长44.%的增幅超过美国,位列全球第一。
不久前,阿里云规划在河北省张北县建成一座专为AI计算服务的超级智算中心,总算力规模达到12EFLOPS(百亿亿次浮点计算),这是当前全球公开数据中规划算力最大的一座智算中心,超过谷歌此前建设的9EFLOPS智算中心。
一个全球算力最强的数据中心,就像世界上最大的水电站,既是中国在算力竞争中绝对实力的展现,也是数字产业发展的重要基础设施。
在规模优势的基础上,中国的科技企业正围绕着系统和效率,在算力的“根技术”上寻求突破。以阿里云的超级智算中心为例,通过研发智算集群内的网络、通信和存储技术,能够将几千台机器的并行计算效率保持在90%以上,比传统模式提升了三倍;结合算法平台,针对AI训练和推理工作,更是能够达到十几倍乃至上百倍的效率提升。
简单来说,在摩尔定律接近失效的今天,虽然单台机器已经接近计算极限,但通过系统性的算力技术,可以将几千乃至几万台服务器连成一台“超级计算机”,用最高效的方法,满足数字产业指数级增长的算力需求。
二十世纪的后五十年,IBM等美国公司用大型机统治着算力技术,但在今天,云计算正在带动一次全新的算力革命,大规模的计算体系架构让大型机逐渐成为历史,这正是中国算力和中国科技企业的机会。
拥有核心技术体系,才会拥有技术的话语权。
电梯让摩天大楼成为可能,电车拓展了城市的规模,电力竞争的本质是产业竞争,算力也是一样。计算力指数报告中指出,当前,计算力指数平均每提高一个点,就会带动数字经济增长3.3%,GDP增长1.8%。
以中美正在激烈角逐的自动驾驶行业为例,其模型训练正是一头“吃算力”的怪兽,为核心模型构建出成熟算法是决定技术高低、能否率先突破L3、L4级自动驾驶的关键因素之一。不久前,小鹏汽车宣布在内蒙古乌兰察布建起一座600PFLOPS规模的自动驾驶智算中心,在阿里云的算力优化下,将其模型训练效率提升了170倍。
算力甚至能够彻底改变生产模式。就像新药研发,原本需要成千上万次的蛋白质、分子实验,才能积累足够的测算数据。但在一些领域里,AI计算开始用算法推测出这些实验数据,将几年的实验时间压缩至几天,甚至几小时。
更多新兴产业如遥感气象、精准医疗、人工智能、绿色能源等等,或是借助海量计算提升效率,或是在算力参与下彻底改变生产模式和链路,推动着产业发展乃至变革。而领先、自主的算力技术体系,将成为这些产业发展的地基。
第二次工业革命开始时,美国并不是许多新技术的最初发明者,但美国抓住了巨大的规模和商业优势,很多技术源于欧洲,却在美国实现规模经济、发展最快,从而成就了二次工业革命中的反超。
今天,全球算力竞争打响了下半场,但规模大、投入高、应用广的先决优势已不再是美国独有。这是一场新的机会,算力竞争是一场看不到硝烟的战争,可能会持续十几年、几十年,但赢家不一定再是美国。