今年初,一组数据引发行业关注:中国AI日均Token调用量从2024年初的1000亿飙升至2026年3月的140万亿,两年增长超千倍。与之形成鲜明对比的是,大量算力部署后的实际利用率却令人堪忧。
行业普遍陷入一种“算力焦虑”:采购越多,算力越闲置;卡买得很贵,Token产出却不增反降。尤其过去两年,国内AI算力经历了狂飙突进的“规模竞赛”,各家竞相宣布大规模算力集群部署。然而,真正能够把算力转化为业务价值的企业,却寥寥无几。
问题的症结在哪?算力架构不统一、Token生产稳定性差;生态封闭、跨平台调度成本高;厂商各自为战、标准混乱——这些结构性难题,正在将国产算力推向“内卷”的泥潭。单纯堆砌算力的粗放模式,正在遭遇边际效益递减的残酷现实。
一言以蔽之,算力焦虑的真相不是不够用,而是用不好、用不出Token价值。在刚刚开幕的天津智博会上,光合组织携软硬件全栈生态伙伴,正式打出“开放计算Token谱系”这张牌,不仅为走出算力内卷提供了一张新地图,更在算力生态层掀起一场“Token效率战争”。
01“Token觉醒”:从规模扩张到效率革命
如果说2024年是国产算力的“基建元年”,那么2026年正在成为“Token觉醒”的关键转折点。
一个明显的信号是,运营商和云厂商的定价模式正在发生根本性变化——从传统的“按卡计费”“按时长计费”转向“按Token计费”。阿里云、腾讯云、百度智能云自今年3月以来纷纷将AI服务价格上调5%-34%,中国电信更是启动了164.5亿元的“Token工厂”集采项目。
这一转变的背后,是算力价值评估体系的重构。资本市场对算力公司的估值逻辑今非昔比:过去看谁卡多、谁集群大,现在开始问“Token产出率是多少”、“变现周期多长”。算力不再只是“原材料”,而是需要被“精加工”成高价值Token的生产资料。
然而,现实中的算力部署仍面临三重结构性困境:
一是软硬件适配鸿沟。部分国产AI芯片与主流AI框架、大模型之间存在重重壁垒,国内芯片厂商众多、架构各异,配套软件栈成熟度参差不齐,导致模型迁移到国产平台时常常面临“功能缺失”“精度损失”“性能骤降”的困境。
二是产业链“孤岛化”。 芯片设计公司专注提升单卡性能,服务器厂商致力于硬件集成,软件框架团队优化算法效率,最终用户却疲于在不同技术路线间选择和整合。各方之间缺乏统一的技术接口和标准,导致大量重复性适配工作,资源严重内耗。
三是高端算力缺位。万亿参数规模大模型训练、千亿级数据实时推理,必须依托高可用的万卡级高端算力集群。但在过去,国产算力基础设施规模化落地难、工程化难度高、场景化应用能力弱,高端算力供给形成明显断层。
三重困境相互交织,构成了制约国产算力从“能用”走向“好用”、“规模化用”的系统性瓶颈,更难以有效产出Token价值。而打破僵局的关键,正在从“单点突破”转向“生态协同”。
02光合解法:开放计算Token谱系的三层协同
去年年底,光合组织正式提出“开放架构驱动AI计算体系”,中科曙光、海光信息等核心伙伴进一步加快国产大算力生态建设。不到两个月,这一架构接连实现3万卡、6万卡集群的工程化落地和前沿AI场景覆盖。“开放计算Token谱系”,正是这一开放架构的系统化表达。
所谓“开放计算Token谱系”,不是算力堆砌,而是聚焦硬件筑基、软件提效、应用增值三个层次,构建从底层芯片到上层应用的全链路协同体系。
硬件筑基——以海光“CPU+DCU”双芯底座为算力基石。海光C86 CPU承载通用计算负载,内置国密与机密计算三大硬件安全引擎;深算DCU专注大模型训练与推理场景,全面支持主流AI精度。CPU负责算力调度与基础业务承载,DCU主攻AI加速,二者并行部署、协同调度,确保上层应用在不同负载类型下均可获得高效、稳定的算力供给。
“算力底座稳,Token才能稳。”海光信息总裁助理兼智能计算产品部总经理杜夏威指出,海光一直在夯实双芯底座,构建开放式计算生态。“比如向上下游伙伴开放CPU互联总线协议,打造全栈软件生态,进而让开发者调用Token的成本大幅下降。”
软件提效——基于开放的算力底座整合操作系统、数据库、AI工具栈等,打通产业链协同关键环节,实现Token灵活调度与跨平台流转。光合组织的底层芯片架构全面兼容CUDA等主流软件生态,开发者无需大幅重构代码即可完成模型迁移,显著降低开发门槛。一方面有效化解国产软硬件适配鸿沟,另一方面也打破了“有硬件-缺应用-难迭代”的负向循环。
麒麟信安售前方案专家孙玉峰透露,以前做国产化方案适配,光底层调通就要两三周。开放计算Token谱系把多芯调度、操作系统、上层应用拉通成一条流水线,现在从芯片到业务上线可以压缩到一周以内。“Token从产生到交付,路上堵的时间少了,效益自然就出来了。”
应用增值——通过高效协同的场景化创新放大Token业务价值。光合组织已汇聚6000余家生态伙伴,覆盖关键部件、整机设备、基础软件、应用软件、算力服务等全产业链条。当基础软硬件平台形成互联互通、高效协同的新体系,应用层将具备真正Token效率抓手,大幅降低跨平台调度损耗,全方位激活算力资源效能。
三层协同,形成“全链共生、价值倍增”的整体效应。这不是简单的“1+1+1=3”,而是通过系统性地解决Token成本与价值转化的核心矛盾,实现“高质量、低成本、高价值”的算力供给新范式。
03全栈集结:国产化算力生态协同“全景图”
天津智博会上,光合组织展区成为“开放计算Token谱系”的集中展示场。1700多平方的空间里,包含芯片、整机/终端、软件、应用等完整算力链条,构成了开放生态协同全景图。
在底层算力芯片领域,海光信息带来全系列CPU+DCU产品阵容——CPU产品覆盖桌面终端、边缘计算、云计算、数据中心以及工业控制等全场景应用;DCU面向云端推理、边缘一体机、端侧场景、千亿大模型训练及科学计算等场景,构建了完整的AI加速产品矩阵。
“AI不能只飘在云端。”光合组织嵌入式产品专家张考华表示,工厂产线、变配电站、交通路口,数据实时处理必须在现场完成,甚至需要毫秒级、微秒级响应。海光在开放计算Token谱系中承担着关键底座角色,比如其工控芯片让AI推理从云端延伸到边缘——在高温、振动等严苛环境里,也能稳定地把Token算出来。
在高端计算领域,中科曙光也首次集中公开展示了全栈智算系统。其中包括新一代8卡全国产AI服务器、世界首个无线缆箱式超节点scaleX40、首个单机柜级640卡超节点,以及最大可支持超十万卡部署的scaleX万卡超集群系统。国产大算力工程化落地能力一览无遗。
以开放的芯片底座和计算系统为牵引,产业上下游全栈正在快速集结。同期,众智FlagOS-光合组织生态联合创新启动仪式将正式落地,会进一步完善开放计算Token谱系。
据了解,面向“人工智能 +”国家战略,众智FlagOS“入谱”后将与光合组织联合打造“算力芯片+大模型+产业生态”的全链条创新平台,围绕Agent推理、多芯调度等方向深化协同推动技术融合、成果共享与产业共生,深度挖潜开放算力生态下的Token价值。
目前,开放计算Token谱系已受到国产化算力生态伙伴广泛认可。尤其在Token成本敏感型领域,旷视智能体产品线负责人认为,算力生态不能只解决“有没有”的问题,还要关注“值不值”的问题。“光合组织做的事,是把算力从‘原材料’升级为‘预制菜’,硬件、软件、应用全链路协同,让大家不用自己从头搭灶台,Token产出效率的提升是看得见、摸得着的。”
04结语:国产算力的下一站,从“内卷”到“共生”
光合组织的实践表明,国产算力产业正在经历一场深刻的范式转换。过去几年,产业上下游走过了一条“造得出、跑得通”的艰难道路。从芯片设计到整机制造,从操作系统到应用软件,每个环节都取得了令人瞩目的突破。然而,由于技术路线分散、生态割裂,单点突破的边际效益正在递减,甚至某些关键环节陷入内卷式竞争,开放协同、生态共生成为唯一解药。
这正是开放计算Token谱系的理念价值所在。它不是某个厂商的单打独斗,而是以开放架构为纽带,贯穿芯片、部件、整机、平台、应用产业全链路,直接聚焦Token单位产值,打造“算力生产—调度流转—价值转化”的完整闭环。在这个谱系中,成千上万生态伙伴在各自细分领域术业专攻、各司其职,既避免了同一赛道互相消耗,也带动了整体Token生产力。
国家先进计算产业创新中心主任历军曾对此有一个精辟的概括:“拒绝内卷、分工协作”是解决当前AI计算产业痛点的必要手段,光合组织要做的是“全力托举伙伴,共建开放共享、协作共赢生态”。可以预见,随着开放式生态合力愈发强大,Token价值产出真正显现,国产算力赛道竞争规则也将被重新定义。
正如一位生态伙伴在采访中所说:“可能用不了多久,大家选算力平台不再问‘多少钱一张卡’,而是问‘一个Token能帮我赚多少钱’。”这正是国产算力告别“内卷”、迈向高质量发展的真正标志。






