中兴通讯朱建军:繁荣智算生态,共创智算未来
2024年智算云生态大会期间,中兴通讯算力及核心网产品线副总经理朱建军在“云创智汇”云计算创新联合研讨会上发表了《繁荣智算生态,共创智算未来》主题演讲。
朱建军指出,随着人工智能技术的迅猛发展,全球正在迎来一场由人工智能驱动的产业革命。据IDC预测,到2027年,中国人工智能市场的年复合增长率预计将达到47%,这一数字揭示了巨大的潜力和广阔的发展空间。运营商也均应势而变,全面拥抱生成式AI技术,不仅在对内提升效率,比如通过运营智能化升级和自智网络的进阶,对外也在进行赋能。在这一背景下,朱建军提出了智算领域面临的四大关键挑战,并提出了相应的解决方案。
首先,他提出了如何推进全面解耦、降低国产化厂商入局门槛、实现百花齐放的问题。朱建军认为,构建开放的技术生态是构建共赢商业生态的关键。为此,中兴通讯提出了全栈开放智算方案,通过软硬解耦、训推解耦、模型解耦,推动能力组件化和共享赋能,加速AI技术的商业化进程。
其次,针对如何支持多样化算力、随芯选用的问题,朱建军表示,智算的健康发展需要多样化算力以适应不同场景和任务需求,降低风险和成本。为了实现这一目标,中兴通讯在硬件层面提供了一个开放智算基座,兼容多种CPU平台和GPU模组,实现了换芯换卡不换座。在软件层面,支持异厂商异构GPU的统一管理和调度,推动GPU混池训练技术突破,避免单厂家绑定。
再次,朱建军提出了如何以网强算,打造万卡规模集群的问题。为了满足万亿以上模型训练需求,中兴通讯提出从机内和机间两方面优化GPU卡高速互联技术。在机内,提出了开放的OLink互联协议,突破TP8限制,支持16到128张GPU超级计算节点的大算力。在机间,通过集大容量交换芯片能力的不断演进,提供基于标准RoVEv2协议的交换机框盒互联方案,满足从千卡到万卡超大规模算力的灵活组网需求。
最后,朱建军谈到了如何训推并举,加速商业闭环。他建议先与天使客户合作,快速验证迭代技术方案,树立行业标杆。同时,中兴通讯致力于为运营商打造从中心云到专属云的全链路服务,加速大模型在不同场景的落地和应用。
朱建军表示,中兴通讯将与业界共同探索,繁荣智算生态,共创智算未来。通过“开放解耦”、“多样算力”、“以网强算”、“训推并举” 加速AI应用落地,中兴通讯正在推动人工智能技术在各行业的广泛应用,为产业智能化变革注入新的动力。