黄仁勋在 GTC 2026主题演讲中宣告: AI已全面迈入“推理与智能体时代”,未来数据中心将成为生产 Token的“ AI工厂”,每瓦电力生成的 Token数量将决定商业命脉,预计到 2027年英伟达将实现至少 1万亿美元营收, OpenClaw开源项目作为“智能体时代的操作系统”正引领这场工业革命。
2026 年 3 月 17 日,英伟达 GTC 大会在美国圣何塞盛大开幕。在这场被誉为“ AI 行业年度朝圣”的大会上,英伟达创始人兼 CEO 黄仁勋发表了长达两小时的主题演讲,向全球宣告: AI 已从“训练时代”全面迈入“推理与智能体时代”,一场重塑能源、芯片、基础设施到应用的工业革命正在加速展开。
万亿营收预期:推理需求引爆算力新蓝海
黄仁勋在演讲中给出了极为乐观的业绩指引: “去年此时,我看到 5000 亿美元的高确信度需求;今天,我站在这里告诉大家,到 2027 年,这一数字将至少达到 1 万亿美元。我确信,实际的计算需求将远高于此。”
这一万亿预期的底层逻辑,是 AI 工作负载的根本性转变。随着大模型从“感知”“生成”进化到“推理”与“行动”,算力消耗呈指数级攀升。黄仁勋指出,过去两年推理所需的计算量增长了约 1 万倍,使用量增长了 100 倍,整体计算需求增长了 100 万倍。
目前,英伟达 60% 的业务来自全球前五大超大规模云服务商,剩余 40% 广泛分布于主权云、企业、工业、机器人和边缘计算等领域。 AI 的覆盖广度本身就是其韧性所在,这是一次全新的计算平台变革。
Token工厂经济学:每瓦性能决定商业命脉
黄仁勋向全球企业 CEO 展示了一套全新的商业思维— “ Token 工厂经济学” 。他指出,未来的数据中心不再是存储文件的仓库,而是生产 Token ( AI 生成的基本单位)的“工厂”。
“每一座数据中心、每一座工厂,从定义上来说都是受电力限制的。一座 1 吉瓦的工厂永远不会变成 2 吉瓦,这是物理和原子的定律。”黄仁勋强调,“在固定功率下,谁的每瓦 Token 吞吐量最高,谁的生产成本就最低。”
Token 将作为新的大宗商品分层定价:
l 免 费 层:高吞吐、低速度
l 中 级 层:约每百万 token 3 美元
l 高 级 层:约每百万 token 6 美元
l 高 速 层:约每百万 token 45 美元
l 超 高 速 层:约每百万 token 150 美元
黄仁勋明确指出: “在这个 Token 工厂里,你的吞吐量和 Token 生成速度,将直接转化为你明年的精确收入。”
OpenClaw:智能体时代的“操作系统”
黄仁勋将大量篇幅留给了 AI 软件和生态的革命,特别是智能体的爆发。他盛赞开源项目 OpenClaw 为“人类历史上最受欢迎的开源项目”,称其仅用几周时间就超越了 Linux 在过去 30 年取得的成就。
“ OpenClaw 本质上是一个智能体系统,能够管理资源、访问工具和文件系统、执行调度任务、将问题分解并调用子智能体,支持任意模态的输入输出。”黄仁勋直言,“用操作系统的语法来描述,它确实就是一个操作系统—智能体计算机的操作系统。 Windows 让个人计算机成为可能, OpenClaw 让个人智能体成为可能。 ”
他断言,每一家 SaaS 公司都将变成 AaaS (智能体即服务)公司——不只是提供工具,而是提供专精特定领域的 AI 智能体。为了确保智能体安全落地,英伟达推出了企业级的 NeMo Claw 参考设计,增加了策略引擎和隐私路由器。
黄仁勋描绘了未来职场新形态: “未来,公司里的每一位工程师都将拥有年度 Token 预算。他们年薪可能是几十万美元,我会在此基础上再拿出大约一半的金额作为 Token 额度给他们,让他们实现 10 倍效率提升。‘入职附带多少 Token 配额’已经成为硅谷的新晋招聘话题。”
Vera Rubin:推理性能的突破
在硬件层面,黄仁勋发布了英伟达有史以来最复杂的 AI 计算系统—— Vera Rubin 平台。这是一个 100% 液冷、完全消灭传统线缆的系统,过去需要两天安装的机架,现在只需两小时。
通过端到端软硬件协同设计, Vera Rubin 在同一座 1 吉瓦数据中心里创造了惊人的数据跨越:在短短两年时间内, Token 生成速率从 2200 万提升到 7 亿每秒,实现了 350 倍的增长,而摩尔定律在同时期仅能带来约 1.5 倍的提升。
Vera Rubin 平台采用台积电 3nm 工艺和 HBM4 内存,推理性能是 H100 的 5 倍,单 Token 成本可降低 10 倍,目前已获得 OpenAI 、 DeepMind 等大客户订单。首台 Vera Rubin 机架已在微软 Azure 云上运行。
为解决推理条件下的带宽瓶颈,英伟达整合了被收购公司 Groq 的技术,推出 LPU 推理专用芯片。该芯片内置超大 SRAM ,首 Token 延迟低于 0.1 秒,推理速度较 H100 提升 10 倍。通过 Dynamo 软件系统,英伟达将需要海量计算和显存的“预填充”阶段交给 Vera Rubin ,将对延迟极度敏感的“解码”阶段交给 Groq ,实现整体性能 35 倍的提升。
物理 AI:具身智能的“ChatGPT时刻”
黄仁勋宣布, 2026 年成为“ 人形机器人商业化元年 ”。他展示了与迪士尼合作开发的 Olaf 机器人,基于 Omniverse 和 Newton 求解器,能够适应真实的物理世界。
自动驾驶领域迎来重要突破。 NVIDIA RoboTaxi Ready 平台新增比亚迪、现代、日产、吉利等合作伙伴,合计年产量 1800 万辆,并与 Uber 达成重大部署协议。加上此前的奔驰、丰田、通用,阵容进一步壮大。
英伟达升级了通用机器人基础模型 Project GR00T ,推出 DLSS 5 图形技术,通过 AI 生成内容实现电影级实时渲染。工业机器人方面, ABB 、 Universal Robotics 、 KUKA 等企业将物理 AI 模型与仿真系统相结合,推动机器人在全球制造产线的落地。
下一代技术前瞻: Feynman与太空计算
黄仁勋提前揭秘了下一代旗舰架构 — Feynman 。这款专为“世界模型”设计的架构,采用台积电 1.6nm 工艺和硅光子互联技术,单 GPU 推理性能将是 Blackwell 的 5 倍,旨在突破物理 AI 与超大规模集群的极限。
更引人遐想的是,英伟达正在研发部署在太空的数据中心计算机 “ Vera Rubin Space-1 ”。 Thor 芯片已通过辐射认证,正在卫星中运行。在太空中只能依靠辐射散热,热管理是核心挑战,英伟达正集结顶尖工程师攻关,将数据中心级的 AI 算力部署到卫星与轨道数据中心,为天基推理提供高达 25 倍于 H100 的算力。
此外,英伟达还布局数字生物学,旨在将药物研发周期从
10
年缩短至数月。


