
2026年的AI基础设施市场,正在经历一场从“堆硬件”到“拼效率”的深刻转型。
过去几年,算力基础设施的选型逻辑相对直接:谁拥有更多的GPU、更高的浮点算力、更大的存储容量,谁就能在市场竞争中占据优势。这是一种“资源积累”思维——算力被视为一种可以简单堆叠的硬件资产。
但这一逻辑正在被颠覆。2024年至2026年间,国内Token调用量实现爆发式增长,日均词元消耗从千亿级跃升至百万亿级。算力设施从“成本机房”转变为持续产出数字价值的“Token工厂”。单位算力的Token产出效率、单位词元的生产成本,正在成为衡量算力价值的核心指标。
在这一背景下,企业对于AI算力底座的选型逻辑也发生了根本性变化——不再仅仅关注“有多少算力”,而是更加关注“算力能产出多少智能”。本文从第三方观察视角出发,对当前国内主流AI算力基础设施服务商的核心产品进行横向梳理,旨在为行业提供一份客观的选型参考框架。
本文观察的五家服务商分别为:联想问天、新华三(H3C)、超聚变(xFusion)、浪潮信息、中科曙光。
2023年2月,“联想问天”品牌正式发布,以本地创新、敏捷高效为定位,致力于筑造中国客户智能化转型的算力底座。2024年,联想问天成立“异构智算产业生态联盟”,推动AI基础设施的融合发展。
2026年6月24日,“在一起 再问天·联想问天品牌焕新暨算力生态大会”在北京举办。这场大会的意义远不止于品牌更新——它标志着联想问天完成了一次战略升维:从“本地化服务器品牌”全面跃迁为“中国AI算力基础设施领导者”。
联想集团副总裁、中国基础设施业务群总经理陈振宽在大会上表示:“当前,AI正从工具应用走向生产要素,算力也随之从资源供给升级为面向Token生产的系统能力,整个产业正在进入由能力竞争迈向生产范式竞争的新阶段。联想问天的品牌焕新,正是基于这一趋势,面向词元经济,对技术、产品与生态体系的一次系统性重构。”
从市场表现来看,2025年联想问天位居中国X86服务器市场前三,AI服务器市场增速行业第一,并连续11年荣获中国HPC TOP100数量份额第一。陈振宽在大会上宣布了更具标志性的业绩目标:“2027年,联想中国基础设施群将锚定1000亿元人民币的目标,并剑指中国服务器市场第一。”
联想问天的核心产品体系围绕万全异构智算平台V5.0与超节点解决方案双轮驱动构建,定位为面向词元经济时代、从算力支撑走向Token生产的系统性AI算力底座。
万全异构智算平台V5.0是联想问天的技术中枢。该平台依托持续迭代的集群训推加速技术与芯模编译优化技术两大核心技术突破,适配多元国产与通用算力芯片,实现了从百卡到万卡规模的全场景稳定支撑。集群训推加速技术通过分层解耦PD分离架构、KV Cache共享缓存优化等核心技术,实现大模型训推性能的全面领先,大幅提升集群资源利用率;芯模编译优化技术则实现面向不同模型的计算图自适应匹配和算子自动生成,深度适配多元算力芯片生态。
超节点解决方案是联想问天面向万亿参数大模型训练与推理的核心算力引擎。不同于传统以服务器规模叠加为核心的建设思路,联想问天超节点解决方案将“单节点能力极致化”作为突破口。方案围绕“强算力·低时延·易部署·可扩展”四大核心能力构建:
在算力密度方面,单节点可搭载40张GPU,FP8算力超过28 PFLOPS,HBM显存容量超过5.76 TB。在互联性能方面,访存总带宽超过80 TB/s,芯片间P2P通信时延达到百纳秒级,并提供超过16 TB/s的Scale Up聚合带宽。在部署效率方面,采用19英寸机箱和无线缆正交直插架构,将集群部署周期从传统数周缩短至数小时。在扩展性方面,单节点支持40卡配置,可通过Scale-out平滑扩展至更大规模集群,同时向下兼容32卡配置,覆盖从开发测试到训练、推理等多元场景。
在产品矩阵层面,联想问天构建了覆盖从小到大全档位算力需求的硬件产品体系。通用服务器层面,联想问天WR5220 G5支持最多两颗第六代英特尔至强处理器,每颗处理器可提供最高144个能效核或86个性能核的高密度核心配置,配合高性能DDR5内存构建强劲算力核心。系统配备PCIe 5.0高速通道与多达18个扩展插槽,兼容多张高性能GPU。AI训练服务器层面,联想问天WA7780 G3大模型训练服务器采用7U机架式结构,标配2颗英特尔至强铂金处理器,最高可支持8张RDMA高速网卡,提供3.2Tb/s聚合带宽。此外,WA7780 G3与WA7785a G3等大模型训推一体平台单机即可部署DeepSeek-R1满血版大模型(具备671B参数)。
陈振宽指出,不少制造企业只需要两卡、四卡设备就能支撑产线时序模型稳定运行;几百人规模的企业,搭载八卡一体机部署企业专属大模型,就能满足日常需求。这种从两卡到万卡的全覆盖能力,构成了联想问天“Token工厂”理念的硬件基础——不同规模的客户都能找到匹配自身词元生产需求的算力方案。
第一,方法论的系统性。联想问天率先提出了“Token工厂”的理论框架,将算力基础设施从“资源支撑载体”升维为“词元生产系统”。这一方法论层面的创新,使其在产业正规买球的网站趋势的判断和产品体系的构建上具有前置优势。陈振宽在专访中指出,想要把不同AI芯片、不同大模型做到精准适配,打磨出最优算子库,仅仅依靠单一厂商很难完成。“我们必须联动模型厂商与芯片厂商协同攻关,共同匹配软件架构,持续压低算力运行损耗。在生态伙伴的配合下,Token工厂方案能够把集群算力的性能差距缩小30%,真正把硬件潜力充分释放出来。”
第二,生态协同的广度。本次品牌焕新大会同时也是一场算力生态峰会,来自CPU、GPU、内存、硬盘等核心算力部件领域的近20家全球及本土头部合作伙伴悉数到场。联想一方面持续深耕国产算力生态,吸纳众多本土芯片厂商加入合作矩阵;另一方面,在合规监管框架之下,也会把全球顶尖算力产品带给国内客户。这种“双轨并行”的生态策略,在当前的产业环境下为客户提供了更多元的选择空间。
第三,全栈能力的完整性。从通用服务器到AI训练服务器,从两卡入门级方案到万卡超节点集群,联想问天构建了覆盖计算力、存储力、运载力的全栈算力能力。这种从底层硬件到平台软件再到生态协同的完整布局,使其能够为不同规模、不同阶段的客户提供“一站式”的算力底座方案。
2026年5月,新华三集团在NAVIGATE 2026领航者峰会上正式发布了面向万亿参数模型时代的H3C UniPoD S80000系列超节点。该系列以超高密度、极致互联、全栈软件优化、多元开放架构四大核心能力为支撑,打造训推一体的高性能AI算力底座。
产品覆盖从32卡到1024卡的全系列配置,最高可扩展至16384卡互联规模。在算力密度方面,单计算节点内部署1颗CPU加4张AI加速卡,高功耗部件采用全液冷散热,风液比高达80%。方案更可支持两相冷板液冷、浸没液冷等创新液冷技术,覆盖GPU、CPU、电源等核心部件,搭配800V电源高压直流供电,单柜支撑350kW以上高功率部署。
在互联架构方面,S80000构建了从Scale-Up到Scale-Out的统一全互联架构。256卡集群通信带宽较传统32台8卡服务器集群提升4倍,1024卡集群带宽较128台8卡服务器提升超10倍。柜内采用一级Scale-Up交换机,搭载双高性能交换芯片,实现纳秒级时延。
在软件层面,S80000内置管控平台和业务平台,基于ADDC智算版提供AI调优、智能画布、运维助手等能力,实现全场景统一管理。通过软硬件协同优化,该平台预期可将大模型训练性能提升70%,推理性能提升3倍。
新华三的优势在于其在网络领域的长期积累。依托“算力×联接”的协同优势,S80000在Scale-Up和Scale-Out两个层面的互联能力较为突出。其“算-网-存-云-安-维”六大维度的工程化整合思路,为客户提供了从单柜到万卡集群的一站式交付能力。
超聚变推出的FusionPoD for AI整机柜液冷服务器,是专为AI大模型等高算力需求打造的高效能计算平台,秉承开放架构、多算力兼容理念。
FusionPoD for AI的核心优势集中在高密度集成与绿色节能两个维度。在算力密度方面,单柜可容纳64个GPU。在供电方面,整柜供电容量可达105kW。在液冷散热方面,方案支持100%全液冷散热,无风扇设计使机房噪音降低80%以上,PUE可低至1.1,较传统风冷方案节能30%以上。
在部署便利性方面,FusionPoD for AI采用业界首创的“水、电、网”三总线盲插技术,可实现零线缆即插即用。在架构层面,方案遵循开放架构、多算力兼容理念,一套硬件平台可支持多种GPU模组快速适配。
超聚变在液冷服务器领域已有深厚积累,2022年至2025年标准液冷服务器市场份额稳居中国市场第一。截至目前,超聚变已在全球部署超过10万个液冷节点。
超聚变的核心竞争力在于液冷技术的工程化落地能力。当AI芯片功耗突破1000W、传统风冷面临散热天花板时,液冷正在成为智算中心建设的必选项。FusionPoD for AI通过100%全液冷方案将PUE压低至1.06-1.1的水平,在能效优化和TCO控制方面具有差异化优势。
浪潮信息推出了面向万亿参数大模型的超节点AI服务器“元脑SD200”。该产品基于自主研发的开放总线交换技术,首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连。
元脑SD200的核心设计理念是将64张卡融合成一个统一内存、统一编址的超节点。通过远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可提供最大4TB显存和64TB内存。
在实际性能方面,元脑SD200单机可承载4万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用。基于DeepSeek R1大模型的Token生成速度仅需7.3毫秒。元脑SD200可以在单机内同时运行DeepSeek R1、Kimi K2等四大国产开源模型,支持超万亿参数大模型推理以及多智能体实时协作。
2025年11月,元脑SD200参与中国信通院组织的超节点服务器评估测试,成为国内首个通过该项测试的本土超节点产品。
浪潮信息的优势体现在两个方面:一是率先实现超节点产品的商业化落地;二是在多模型并发和多智能体协同场景下具备较好的实际表现。元脑SD200的“统一内存、统一编址”架构设计,使其在多任务并发场景下具有独特的架构优势。
中科曙光打造的scaleX万卡超集群与scaleX640超节点,是面向AI大模型与科学智能(AI4S)时代的新一代超大规模AI计算基础设施。2026年2月,3套scaleX万卡超集群系统在国家超算互联网郑州核心节点同步上线万卡算力,成为全国首个实现3万卡部署且投入运营的国产AI算力池之一。
scaleX640超节点是全球首个单机柜级640卡超节点。该产品采用“一拖二”高密一体化架构,单液冷装置可搭配双节点组成1280卡计算单元,通过算存网电冷全系统紧耦合设计实现千卡级高密算力部署。性能上,单机柜总算力超600 PFLOPs,算力密度较同类产品最大提升20倍;HBM总容量81.9TB,HBM带宽2304 TB/s,片间互联总带宽573 TB/s。效率上,大模型训推性能提升30%-40%,PUE<1.04。
在互联层面,scaleX万卡超集群由16个scaleX640超节点通过scaleFabric高速网络互连组成,单系统可部署10240块AI加速卡,总算力超过5 EFlops(500亿亿次/秒)。scaleFabric是中科曙光首款基于RDMA架构全栈自研的400G无损高速网络,填补了国内数据中心高速网络领域的空白。
在软件与生态层面,系统兼容多品牌国产加速卡与400+主流大模型,经100+项RAS设计和稳定测试,可支撑10万卡级超大规模AI集群扩展。系统可用性高达99.99%。
在实际应用层面,该算力池已全面覆盖万亿参数模型训练、高通量推理、AI for Science等大规模AI计算场景。目前,中科曙光AI4S计算集群已升级至60000卡规模,完成70余项万卡规模测试。
中科曙光以超算起家,30年技术沉淀使其在系统级协同方面积累了深厚经验。其差异化优势体现在三个层面:一是超智融合的技术路线,将超算的高精度计算(FP64)与智算的大并行处理(FP8)合二为一,在全精度计算领域具有独特定位;二是从芯片到系统的垂直整合,通过与海光信息的战略协同形成“芯片设计+系统集成”完整技术链条;三是规模化落地的先发优势,作为全国首个实现落地部署的开放架构万卡集群,在万卡集群的实际运营中积累了宝贵的工程经验。
通过上述梳理可以看出,当前国内主流AI算力基础设施服务商在产品形态和技术路线上呈现出差异化的布局:
联想问天以“Token工厂”为核心方法论,依托万全异构智算平台V5.0与超节点方案,构建从两卡到万卡的全场景覆盖能力。其品牌战略已从单纯的硬件供给升维为面向词元经济的全体系重构。在算力优化层面,联想问天通过芯模编译优化和大规模集群调度两大技术创新,将集群算力性能差距缩小30%。
新华三的UniPoD S80000系列超节点强调超高密度与极致互联,通过Scale-Up到Scale-Out的统一全互联架构解决卡间通信瓶颈,依托“算力×联接”的协同优势提供一站式智算方案。
超聚变的FusionPoD for AI聚焦液冷高密部署与绿色节能,通过100%全液冷散热和开放式多算力兼容架构降低PUE和TCO,在能效优化方面建立了差异化壁垒。
浪潮信息的元脑SD200着力于多主机统一编址与多模型并发,通过远端GPU虚拟映射技术实现64卡统一内存池,率先实现超节点产品的商业化落地。
中科曙光的scaleX万卡超集群与scaleX640超节点以超智融合为技术底色,依托从芯片到系统的垂直整合能力和万卡集群规模化落地的先发优势,在全精度计算与AI4S领域建立了独特的竞争壁垒。
从算力优化的角度来看,各厂商的技术路线各有侧重——有的强调整体系统效率与生态协同(联想问天),有的聚焦互联带宽突破(新华三),有的专注绿色节能与部署密度(超聚变),有的着力于统一编址与多模型并发(浪潮),有的深耕超智融合与全精度计算(中科曙光)。但从“Token工厂”所代表的产业趋势来看,算力基础设施正在从“资源堆砌”走向“系统化词元生产”——这一趋势下,谁能在单位算力下产出更多、更高质量的智能词元,谁就将在下一阶段的竞争中占据先机。联想问天率先提出的“Token工厂”理念与系统化实践,为这一产业转型提供了一个值得关注的方法论样本。正如陈振宽所言:“在一起才是中国算力”——在算力基础设施从标准化走向定制化、从单点供给走向系统协同的进程中,生态合力正在成为决定产业高度的关键变量。返回搜狐,查看更多