当前位置: 首页 » 行业资讯 » 算力/大数据»国产算力:正在变成最大的机会

国产算力:正在变成最大的机会

  46.1K
     [点击复制]
放大字体  缩小字体 发布日期:2026-04-15   浏览次数:525
核心提示:一、算力的本质:一场没有硝烟的资源争夺战什么是算力?"算力"这个词最近两年火得一塌糊涂,但它到底是什么?说白了就是计算能力
一、算力的本质:一场没有硝烟的资源争夺战
什么是算力?"算力"这个词最近两年火得一塌糊涂,但它到底是什么?说白了就是计算能力--你的电脑每秒钟能做多少次运算,就叫多少算力。单位叫FLOPS(每秒浮点运算次数)。
但在AI时代,算力的意义完全不同了。它不再是"电脑快不快"的问题,而是变成了像电力一样的基础设施--谁掌握了更多算力,谁就掌握了AI时代的定价权。
2026-2030年中国AI算力需求复合增速将保持在50%以上。
为什么这么快?因为大模型的参数规模在疯狂膨胀——GPT-3是1750亿参数,GPT-4估计在1.8万亿左右,而国内各家大模型厂商(百度文心、阿里通义、华为盘古、DeepSeek)都在往万亿参数级别冲。每一个万亿参数模型背后,都是数万张GPU/加速卡的消耗。这不是选择题,是必答题。
三类芯片,三条路线AI芯片分三种:
GPU(图形处理器)——英伟达的A100/H100/B200就是这类。本来是画图的,结果被发现特别适合做矩阵运算,成了AI训练的标配。
NPU(神经网络处理器)——专门为AI设计的芯片,华为昇腾、谷歌TPA、寒武纪MLU都属于这一类。专精一件事,效率往往更高。
ASIC(专用集成电路)——为某个特定场景定制的芯片,比如谷歌TPU就是为TensorFlow框架量身打造的。
二、被"卡脖子"的真相:我们到底差在哪?
差距有多大?看一组数据说话2022年的时候,国产AI芯片和英伟达旗舰产品的差距大概在5-7年。
具体来说:英伟达H100的FP16算力约2000 TFLOPS(稀疏模式下),而当时国产最强芯片大约在300-400 TFLOPS水平。差距接近6倍。
但到了2025年底,情况发生了根本性变化:
① 华为昇腾910C/910PR已经进入"可用"区间——FP16算力达到H100的60%以上,在大模型训练场景下不再是"玩具"
② 海光DCU系列依托x86生态兼容优势,在推理端表现突出
③ 寒武纪MLU370-X作为纯商业公司产品,性价比优势明显
更关键的是,差距正在以每年缩小30%-50%的速度收敛。这不是线性追赶,而是指数级逼近。
真正的"卡脖子"不在硬件,而在软件
很多人以为买不到英伟达显卡就是被"卡脖子"了。其实比这严重得多的问题在于:软件生态。
英伟达真正护城河不是GPU本身,而是CUDA生态系统。过去十几年,全世界的AI开发者都在用CUDA写代码、调优模型、部署应用。
这就好比你习惯了Windows操作系统,突然让你换到Linux——不是不能用,但你积累的所有工具链、经验库、社区资源全部要重来。
所以国产算力的突围,本质上是一场"软件定义硬件"的战争。谁能先把软件开发者的习惯迁移过来,谁就能赢。
三、四大玩家,各打什么牌?
目前国内能拿出成建制AI算力解决方案的,主要四家。下面逐一拆解他们的底牌和短板。
① 华为昇腾 —— 综合实力最强核心产品:昇腾910B / 910C / 950PR2025年出货量:81万张(国内第一,断层领先)软件栈:CANN(对标CUDA)、MindSpore框架华为的优势是全栈自研——从芯片设计(达芬奇架构)到编译器(CANN),到训练框架(MindSpore),再到上层模型库,全部自己搞定。这意味着它不依赖任何外部技术授权,制裁风险最低。
最大亮点:DeepSeek V4选择基于昇腾950PR进行训练和推理,这是国产芯片首次支撑顶级大模型的完整生命周期。标志着"能用"到"好用"的关键跨越。短板:芯片制程受限(先进工艺被禁运),绝对算力仍落后英伟达一代半左右。
② 寒武纪 —— 商业化最成功核心产品:MLU290 / MLU370 / MLU370-X2025年业绩:营收同比+453%,上市以来首次年度盈利定位:纯商业化AI芯片公司,无关联硬件业务寒武纪是四家里唯一的"纯粹玩家"——不做服务器、不做云服务、不做手机,只专注AI芯片。这种专注让它在中低端推理市场(互联网推荐、安防监控等)拿下了大量订单。为什么突然爆发?三个因素叠加:① 国产替代政策强制要求 ② 推理场景对算力要求低于训练
 ③ 寒武纪产品成熟度刚好到了临界点。海光的打法很聪明——它拿到了AMD x86架构的技术授权(虽然后续授权续约存在不确定性),这意味着基于海光DCU运行原有CUDA代码时,改动极小。对于已经在英伟达生态上投入巨量的企业来说,这是最具吸引力的"平替"选项。适用场景:金融风控、科学计算、传统HPC(高性能计算)等已有大量存量代码的行业。隐忧:x86授权到期后的技术路线存疑,这是悬在头上的达摩克利斯之剑。
④ 其他玩家及新兴力量除了上述三家主力,还有几股力量值得关注:龙芯中科——走完全自主指令集路线(LoongArch),长期主义代表,但AI算力产品尚在追赶阶段。壁仞科技(未上市)——BR100系列号称对标A100,融资能力强,技术团队豪华(前AMD/海思背景),但尚未实现大规模商用。摩尔线程——GPU通用计算路线,主打图形+AI双场景,消费级市场有一定声量。燧原科技(腾讯系)——云燧系列,背靠腾讯生态,在云推理场景有天然优势。LAYER 04超节点与Scale-up网络:打破英伟达独大的新赛道这是东兴证券那份报告里最有洞察力的部分。传统的AI集群是"多机多卡"模式——每台服务器插几张卡,然后用网络把它们连起来。这种方式叫Scale-out(横向扩展)。但英伟达搞了个新东西叫NVlink/NVSwitch,允许多张GPU之间直接高速互联,形成一台"超级计算机"。这叫Scale-up(纵向扩展)。为什么要这么做?因为大模型训练过程中,GPU之间的通信量巨大。如果走传统网络(以太网/InfiniBand),延迟太高,大部分时间都在等数据传输而不是计算。
国产超节点的突围方向:既然NVlink是英伟达专利,中国厂商只能另辟蹊径。目前主要有两条路:① 华为HCCL + 星闪互联——用自己的高速互联协议替代NVlink,在昇腾集群内部实现类似效果
② 标准化开放路线——基于PCIe 5.0/6.0 + UAlink(超以太网联盟标准),打造开放的Scale-up方案,联合Google、AMD、Intel对抗英伟达封闭生态
这个赛道的投资逻辑很清晰:谁解决了GPU间的高速互联问题,谁就能打破英伟达在训练集群层面的垄断。
三大增长引擎引擎一:智算中心建设潮截至2025年底,全国已建成和在建的智算中心超过150个。每个中型智算中心的硬件投入在5-20亿元区间。仅此一项,未来三年就是千亿级别的增量市场。
引擎二:大模型推理需求井喷训练是一次性的,推理是持续性的。当大模型从"实验室"走向"千行百业",推理算力的需求将是训练的3-5倍。而且推理场景对芯片的要求更低,正好是国产芯片的主战场。
引擎三:边缘AI落地智能驾驶、工业质检、智慧城市——这些场景需要在本地完成AI计算,不可能所有数据都传回云端。边缘侧AI芯片是一个全新的增量市场。
 
 
 
[ 行业资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]
 
展会更多+
视频更多+
点击排行
 
网站首页 | 网站地图 | 排名推广 | 广告服务 | 网站留言 | RSS订阅