大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

2026 AI存储行业迎来关键时刻:英伟达“补课”,华为存储“解题”

智能相对论 2026-04-29

文 | 智能相对论

作者 | 陈泊丞

数十亿建成的万卡GPU集群,实际利用率不足40%。

这不是某个智算中心的个例。在过去两年里,中国涌现了大大小小几十个智算中心项目,GPU买了一批又一批,但真正跑满的时候不多。问题不在芯片本身——而在数据供给跟不上。

GPU在空转,等存储喂数据。这件事说起来简单,但背后却是一笔巨大的“沉没成本”:花了几十亿建算力,最后发现瓶颈卡在存储上。

事实上,整个行业都在讨论“算力瓶颈”,但真正拖慢中国AI落地节奏的,很可能是存储。

有意思的是,正是在这届GTC上,英伟达第一次把“存储”放到了与“算力”并列的位置。它在超节点中内置独立的存储柜,定义新的AI存储参考架构(STX/CMX),并联合12家存储厂商发布解决方案——这不是英伟达的常规操作。

一家靠GPU起家的公司,为什么突然对存储这么上心?这背后,是AI产业底层逻辑的一次根本性转变。

英伟达在GTC上给全行业补了一堂存储课

要理解英伟达在GTC上的动作,先得回答一个问题:为什么它要在这个节点做这件事?

答案的背后是一个正在发生的大趋势:从“训练为王”到“推理为王”的阶段性转变。

过去几年,AI行业的主要矛盾是“模型不够大、训练不够久”。那时候存储是配角,GPU喂饱了数据就行。但是,当大模型开始大规模落地,推理变成了主战场,整个故事的底层逻辑就变了。

推理需要什么?实时、低延迟、海量随机读写的数据访问。这跟训练阶段完全不同——训练可以批处理,而推理必须秒级响应;训练可以提前准备好数据,而推理得随时待命。

黄仁勋在CES和GTC上都说过一句话:“KV Cache的激增足以催生一个全新的存储市场”。这话听着像营销,但仔细想想,GPU厂商第一次公开承认“计算不再是最稀缺的资源,数据供给才是”,这本身就是信号。

基于这个认知,英伟达在GTC上直接打出了三张关键牌,分别为CMX、AIDP和SCADA,对应回答的是不同层次的问题。

CMX也就是G3.5层,回答“推理太贵”的问题。当KV Cache从显存溢出到存储池,推理成本的核心矛盾从“算力贵”变成“数据供给贵”。英伟达用CMX架构把存储性能与GPU计算进行了深度绑定,这套玩法本质上是“极致协同设计”——存储不再是外挂硬盘,而是GPU系统的延伸。

其次,AIDP回答“数据不敢动”的问题。深入行业真实需求来看,企业不是没有数据,而是数据不敢搬、不能搬。譬如,金融客户的数据出不了机房,政务系统的数据有合规要求,医疗数据碰都不能碰。因此,英伟达提出“Data-in-Place”(数据就地处理),本质是让AI能力下沉到存储里,减少数据的搬运。

SCADA 回答“GPU吃不饱”的问题。在推荐系统、图神经网络这些场景,GPU需要从海量数据中随机读取极小粒度的数据。然而,传统I/O路径太重,GPU经常“饿着肚子等数据”。为此,SCADA允许GPU绕过了CPU直接访问存储,带宽接近HBM,支持EB级数据集——很显然,这是为未来的实时决策场景铺路。

三张牌,三层问题,从眼前到当下再到未来,构成了英伟达对AI存储的完整判断。也正是在这个判断下,英伟达喊出了“2026 is the year of AI storage”。

中国市场的“冰与火”:最旺盛的需求与最普遍的误判

把视线拉回中国。

事实上,中国是全球AI存储需求最旺盛的市场——这话不算夸张。智能客服、RAG知识中台、代码生成、自动驾驶仿真、智能制造......这些场景的落地速度实实在在走在了全球前列。

在政策层面,“人工智能+”全面铺开,数据要素×三年行动计划启动,“东数西算”2.0推动算电协同——从合规、基建到成本,政策红利也在多个维度拉动了高质量存储建设。

客观而言,需求是真的。但这枚硬币还有另一面。

多数智算中心的存储投入占比不足10%,剩下的钱几乎全砸进了GPU服务器。结果呢?GPU集群利用率普遍低于40%,“算力过剩与存储瓶颈并存”成了一种荒诞的现实。花了几十亿买算力,最后发现卡脖子的不是芯片,是数据供给。

这不是技术问题,是认知问题。整个行业的注意力都被“算力”两个字吸走了,没人认真想过,卡能跑满吗?

更棘手的是,冰层之下还有结构性掣肘,不是喊两句口号就能解决的。

比如标准缺失。面向昇腾、海光这类国产算力的存储架构和评测标准几乎空白,厂商各自为战,集成成本高企。再比如生态碎片化。国内存储产业硬件能力强,但核心软件能力比如KV Cache调度算法、数据就地处理引擎——与英伟达的“极致协同设计”相比,还有肉眼可见的差距。

中国有最大的市场需求,但缺乏把需求转化为产品的生态协同能力。这个矛盾不解决,需求旺盛就只是数字好看,落不了地。

最核心的问题,可能要靠存储厂商来回答

那么,这个局怎么破?

回归一个朴素的问题:谁最懂数据?

当整个行业都在讨论“用更多GPU训练更大模型”时,做存储的人在琢磨另一件事:数据从哪来、如何治理、怎么让AI用得上——这是两种完全不同的视角。算力厂商看的是“模型需要多少Flops”,存储厂商看的是“模型需要多少数据、怎么高效喂进去”。

这个视角差异,在AI大规模落地的阶段,变得前所未有的重要。

英伟为什么要定义AIDP参考架构并交给存储厂商推出解决方案在企业落地?因为越来越多的厂商意识到,数据供给的入口正在成为AI基础设施的核心卡口。存储不再是配角,它可以是主角,是AI系统的“数据中枢”。

正是基于这个判断,华为打破了传统存储的烟囱式结构,用一套底座即AIDP(AI Data Platform)架构覆盖了三大场景。

这套架构的核心逻辑其实很朴素:客户不需要为KV Cache、AIDP、SCADA分别建三套系统,这不是成本问题,是现实不允许。举个例子,一个智算中心可能有昇腾和海光的卡要兼顾,一个金融机构的数据不能出域但又要支撑实时推理——这些矛盾不是买更多GPU能解决的,需要的是一套能统一调度、分层处理、渐进演进的存储架构。

围绕这个逻辑,华为在每一层都埋了具体的能力。

G3.5层,UCM(统一缓存管理器)实现显存与存储间的秒级热迁移,推理并发能力提升数倍——这解决的是“推理贵”的问题,让PB级KV Cache不再必须驻留在昂贵的HBM显存里。

企业AI层,VSS向量检索和RAG能力直接内嵌到存储系统,数据不用搬出去就能被调用——这解决的是“数据不敢动”的问题,合规要求不是束缚,而是架构设计的起点。

SCADA层,预留GPU Initiate IO接口,支持未来GPU直接访问超大规模数据集——这一步是面向未来的,目前能落地的场景有限,但架构要提前站位。

三层能力对应三层价值:眼前的降本、当下的合规、未来的扩展。这不是功能堆砌,是有优先级判断的演进路线。

落地层面,基于OceanStor A800高性能AI存储和OceanStor Dorado全闪存存储,华为提供了一体化和独立式两种交付模式——前者面向新建场景,后者面向存量系统的渐进式改造。不同客户的现实处境不同,解法也不同,这本身就是务实的体现。

说到底,中国AI存储市场需要的不是“英伟达的中国版”,而是一条适配本土需求的务实路径。华为在做这件事,不代表它是唯一答案,但这条路线的核心判断——统一底座、平滑演进、数据安全内生,确实回应了当前市场最真实的痛点。

结语

GTC 2026或许只是起点。

英伟达在补课,存储厂商在解题,中国市场的需求在倒逼整个行业重新审视这个问题。当“算力”不再是稀缺资源的代名词,数据供给的效率正在成为下一阶段AI竞争的关键变量。

当然,“重算力、轻存力”的惯性思维不会自动消失。它需要有人指出这个问题,需要有人用实际案例证明:存储投入的ROI,可能比追加GPU更能提升整个系统的效率。

这不是华为一家公司的事。这是整个行业都需要回答的问题。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+、、、AI+、AI+、AR/VR、、开发者以及背后的芯片、算法等。

从中国走向硅谷!斑陌易行全球首个端到端无人车引爆无人车配送革命
硅谷时间4月28日,The Magic X 全球具身智能创新大会在美国硅谷成功举办。作为无人配送科技新锐,斑陌易行总裁陈强受邀出席并发表主题演讲,面向全球发布乐高式模块化无人配送平台、SmartVLA 端到端大模型、AI 原生大脑 Brain2.0三大核心技术,并重磅展示旗舰

2026-04-29

知悉(Notified) 推出 AI 新闻稿优化器,旨在强化企业叙事并增加 AI 引用量
新工具助力传播团队最大化 AI 曝光度核心事实(一览):发布:知悉(Notified) 推出 AI 新闻稿优化器,这是 Content OS™ 内置的原生工具,旨在提升新闻稿被 AI 与问答引擎检索,理解、引用和使用的机率。目的:AI 新闻稿优化器可帮助传播团队在分发前强化新

2026-04-29

戴森发布全新Omega™菁油修护系列,同步推出美发科技品类柔雾杏限定新色 为夏日造型注入鲜活灵感
[中国上海,2026年4月29日]戴森今日正式推出第二款护发配方产品系列——Dyson Omega™菁油修护系列,同步推出柔雾杏限定新色美发科技产品。Omega™菁油修护系列产品是戴森首款采用自有农场葵花籽油的护发配方。戴森自用农场拥有九公顷的向日葵田,每年可采收

2026-04-29

“五一”小龙虾堂食将迎小高峰,节前抖音团购销售额同比增长59%
“五一”假期临近,全国吃住行、游购娱等多类消费需求旺盛。4月29日,抖音生活服务发布“五一”假期消费前瞻数据,4月11日至4月27日,平台上地方菜团购销售额同比增长43%,酒店宾馆增长54%,景点票券增长45%,综合商场增长88%。三线及以下小城游受热捧,柳州

2026-04-29

科大讯飞闪耀2026北京车展,让智能汽车会办事、更懂你
2026年4月24日,第十九届北京国际汽车展览会盛大启幕。领时代,智未来!科大讯飞携星火新一代多模态智能座舱、iFLYSOUND智慧声场氮化镓母带级声学系统以及星火海外大模型重磅登场,重新定义AI座舱的智能边界,让智能汽车成为会办事、更懂你的出行伙伴,为中国

2026-04-29

科大讯飞2025年实现营收271.05亿元 大模型赋能行业加速商业化落地
4月28日晚,科大讯飞(002230,SZ)发布了2025年年度报告。2025年,公司实现营收271.05亿元,同比增长16.12%;归母净利润8.39亿元,同比增长49.85%;扣非净利润2.64亿元,同比增长40.47%。当前,人工智能正处于从技术突破到规模化商业落地的关键阶段。得益于

2026-04-28

2026年,资本正“沿着产业集群”给AI公司定价
北“模型+应用”,南“具身+硬件”。

2026-04-28