集微网报道(文/李映)伴随着ChatGPT的爆红,大算力时代正呼啸而来,一场真正的划时代性技术变革也急行在路上。
(资料图)
数字经济学者刘兴亮在近日举办的“时代的增量——AIGC浪潮与算力变革”主题沙龙演讲中认为,大算力时代表明在当前的社会和技术发展阶段,大规模的计算资源和高级别的计算能力变得可用和普遍。大算力时代的特点在于:一是数据被广泛用于决策、优化和预测。二是AI和机器学习成为日常生活和各行各业的一部分。三是高性能计算资源变得更加可达和实用。四是新兴技术潜力开始展现,生成式Al、大数据的处理与分析、量子计算、虚拟现实和增强现实技术等,都会是大算力时代的关键创新。
毋庸置疑,“算力+AIGC”可谓数字经济未来10年发展的新引擎,当下国内诸多科技、互联网和创业公司争先恐后陷入“百团大战”。但从长远出发,一方面要考虑大模型的落地之路,另一方面需着力克服算力、算法和数据的多重挑战。一场由技术组合带来的超预期变革——美第奇效应也将在ChatGPT引发的一连串技术革新中,催生智能时代的勃兴。
大模型走向分野 落地要与垂直行业结合
目前令人眼花缭乱的大模型之争,也将在未来走向分野。
清华大学新闻学院教授、博士生导师沈阳分析,国内大模型将形成三个方向:一是以百度、阿里等为代表的巨型互联网平台公司,打造开源、平台基座型的模型持续长期巨额的投入,这是一种巨无霸式的战争。二是国产安全可控的路线,侧重于政务等领域,类似于信创。三是走向整合,未来大模型随着时间演化可能也就剩三五家,参考移动互联网时代全球操作系统只剩三家——IOS、安卓、鸿蒙,到目前为止,ChatGPT类似于IOS,Meta的LLaMA模型可看作安卓,谁将是中国的鸿蒙?
而从规模上来看,也呈现出两大相反而并行不悖的趋势。
“一是巨大模式即全模态(Bigger and Smarter),这要求训练海量参数,提供涌现能力。未来单一模型到跨模态模型,包括视觉、音频、文本、温度等,未来还将加入触觉、嗅觉和大脑功能磁共振信号,进阶到元宇宙模型。二是小微模式即模型压缩和优化(Free and Smaller),力争在保持较高预测准确性的同时,大幅减小模型的大小和计算成本,优化计算效率。众多行业可在开源模型基础上微调,增加垂直领域的知识,这样投入将大幅减少,开源微调也将实现大发展。”沈阳表示。
不论走向何方,落地是必然要接受的考验。中兴通讯副总裁、通讯服务器存储产品线总经理郭树波提到,AIGC可产生实际应用,且慢慢从虚向实,目前来看各行各业均在着力建设大模型。而且,大模型真要落地的投资巨大,如能结合垂直行业落地将化解这一难题。参照互联网起源于美国、繁荣于中国,如今在搜索、社交、购物等细分行业全面开花,相信大模型镜鉴这一路线不断结合垂直行业落地,将逐渐做大做强。
对此沈阳建议,从大模型产业格局走向来看,在竞争中要考量产业融合效率,即融合速度和成本与产业的关联,达到算力与数据平衡,实现多元共生。
刘兴亮也强调说,通用生成式AI更大的应用在于垂直领域,可与医疗、教育等各行各业有机结合,这是一大机遇也是创业公司的新机会,但在这一过程中不要太急功近利。
围绕内容生成,百度内容生态平台总经理宋健分享道,AI不是可选,而是创作必选,AIGC正成为内容行业新蓝海,推动内容生产的代际飞跃,这也需要硬件技术发展、生产力创新和分发技术变革的支撑,百度也将围绕这些方面持续深入布局。
数据挑战巨大 算力走向多元化
透视AI大模型的风起云涌,仍离不开数据、算力等基石,同时绿色低碳也至关重要。
郭树波认为,在数据层面,数据训练量的问题值得重视,因大模型的AI训练数量越多会越准确,相比之下国内仍有一定差距。
针对数据的演变,沈阳的看法是以往大部分数据都是人类创作出来的,可称为“碳基生命数据基本百分之百饱和度状态”。但从业界大量采用人工智能来输出内容之后,未来绝大部分数据和内容都是由AI和硅基生命产生的,这是历史的重要转折点。
除对数据要加以重视之外,还可看到算力这一底座基石的重要性。正如郭树波所言,从生产力经历的四个阶段来看,从农业时代的生产力主要是人力、到驯服了牲畜之后以后生产力进入了畜力时代,再到工业时代动力为生产力,到如今智能时代算力则成为重要的生产力,未来算力就像用水和电一样自由。
算力对经济增长的重要性从数字上也可见一斑。据悉,在算力上每投入1%能带来的价值,数字经济可以提升千分之3.3,GDP增长千分之1.8。此外,大算力时代也在催生算力基础设施建设更高的要求,尤其是服务器和存储的规模持续提升。根据IDC预测,中国服务器规模将持续增长,2022年约276亿美元到2025年将达到357亿美元。
庞大算力需求将对算力基础设施提出更高要求,“智算”需求走高,将迎来蓬勃发展。有分析说,未来发展到一定阶段,通算或被智算替代。
从目前来看,算力发展存在一些瓶颈。郭树波指出,一是算力发展不均衡,包括全球和国内分布不均衡;二是单一通用算力无法满足算力增长的快速要求。三是针对算力摩尔定律逐渐失效,过去说18个月晶体管翻一倍,但目前每12个月算力的需求就已翻番。
为应对上述挑战,郭树波分析,一方面这需要超高性能异构算力以及更多元化的算力如NPU、DPU等,GPU不会一卡通吃天下;另一方面,为了降低时延和提高带宽,超高带宽网络和存储技术将衍生出很多新技术。此外,随着低碳成为必然趋势,传统的散热方式已无法支撑,要采用新的液冷技术。
目前液冷有浸没式、冷板式、喷淋式等方向,郭树波介绍,中兴通讯的选择是冷板式液冷,因可简便实现服务器与机柜的解耦,只需将冷板替换原来的散热片,且冷板维护不影响原有的设计,PUE还可做到1.13。而浸没式液冷技术尚不成熟,存在占地面积较大且运维复杂等难题。
夯实底座 持续助力算力产业大发展
针对数字经济大算力的强劲增长,中兴通讯作为“数字经济筑路者”,凭借自身38年来深耕ICT领域的技术积累和创新成果,持续着力打造新型算力基础设施,助力算力产业高质量发展。
据介绍,中兴通讯已拥有全系列服务器及存储产品,包括通用服务器、GPU服务器、液冷服务器以,实现了同构和异构的多元化算力,同时也支持国产化CPU和GPU平台;全闪、混闪存储产品则可满足众多场景的存储需求。这些设备拥有高速交换、智能加速、高压直流、配置灵活、大存储等特性,可为5G、虚拟化、人工智能、大数据、边缘计算等提供有效支撑。
为支撑服务器运维和节省用户投资,郭树波还提到,中兴通讯在产品设计时禀承两大理念:一是“硬件模块化”,同一个2U2路机箱或者4U4路机箱可在不同的平台之间共享,差别是主板不同。二是“软件平台化”,处理器平台或BIOS尽量一致,不同的处理器平台可共享BMC,实现通用化。
在这些利器的加持下,中兴通讯的服务器和存储产品自2018年以来需求量持续增长,出货量从2.3万台攀升至2022年的24.7万台。并且,已规模化进入互联网、金融、能源、政务等行业助力数字化转型,跻身通信行业领军品牌。
特别值得一提的是,在存储领域,中兴通讯是国内真正实现自主研发的三家厂家之一。最近中兴通讯和百度还联合宣布,中兴通讯服务器将支持百度“文心一言”,为AI产品应用提供更加强劲的算力支撑。
面向未来,中兴通讯也志存高远。郭树波强调,中兴通讯将紧抓算力时代新机遇,紧跟行业趋势,持续加大投入,助力智算百花齐放,并着力降低成本,解决“智算高投入”的问题。在高密度、模块化、精细化的服务器及存储产品在内的系列算力基础设施持续进阶,致力于成为“绿色算力主力军”,助力数字经济大发展。
关键词: