英伟达掀桌,Windows 终于迎来真 AI PC

Windows PC 阵营,已经很久没有遇到真正有分量的闯入者了。

Windows 用户 belike

过去四十年,这个市场的基本分工相对稳定:微软定义操作系统和软件入口,Intel 与 AMD 长期把守 x86 处理器平台,英伟达则从图形计算出发,后来又把 AI 加速推到更高的位置。

文章配图-1

而就在黄仁勋刚刚结束的 2026 年 COMPUTEX 主题演讲上,英伟达沿着 AI 基础设施这条主线,进入更多产业的核心环节。

除了 GPU 、AI 工厂、物理 AI 等老生常态的话题,还有被微软和 ARM 提前预热、打着「A new era of PC」旗号的 RTX Spark。所有产品背后,都围绕同一个关键词展开:

Agent、Agent,还是 Agent。

文章配图-1

联手微软,英伟达要重新定义个人 PC

在 Agent(智能体)叙事里,PC 被放到了一个新位置。

四十年来,Windows、开放 BIOS、芯片组、驱动、多媒体 API 一起塑造了个人计算。Windows 95 让 PC 从企业设备变成消费电子产品,几乎每个人都需要一台电脑。

文章配图-1

现在,微软和英伟达将重新定义 AI PC ,目标是要让 PC 原生运行智能体,让个人电脑从传统应用入口变成个人 AI 平台。

文章配图-1

今天推出的英伟达 RTX Spark 处理器是这套新 PC 体系的核心。

它搭载 Blackwell RTX GPU,FP4 AI 性能达到 1 petaflop;CPU 部分是与联发科合作定制的 20 核 Grace CPU;内存为 128 GB 统一内存,并通过 NVLink C2C 提供 600 GB/s 带宽。软件层面,完整栈包括 CUDA、TensorRT、NVFP4、RTX Ray Tracing、DLSS、Reflex 和 G-SYNC。

文章配图-1

在产品形态上,英伟达把 RTX Spark 放进了更接近主流 Windows PC 的尺寸里:

笔记本厚度可做到 14 毫米,重量约 3 磅,覆盖 14 英寸到 16 英寸机型;机身采用精密加工铝合金,屏幕部分则配备色彩准确的 tandem OLED,并支持 NVIDIA G-SYNC,既服务创意工作,也兼顾游戏和高帧率视觉体验。

换言之,RTX Spark 面向的场景不只是端侧语音助手或轻量办公场景,它试图把部分数据中心 AI 能力、游戏图形能力和专业创作能力,放进个人电脑形态里。

文章配图-1

黄仁勋说,这台电脑要运行「所有东西」。传统 Windows 应用要能跑,CUDA 软件栈要能跑,图形工作流、数字生物、地震处理、天体物理、基因组学和 AI 应用也要继续运行,它既可以连接本地模型,也可以连接云端模型。

在现场演示视频中,用户给出场地、草图、风格参考和需求后,运行在 RTX Spark 上的智能体会调用 Rhino 完成建筑与室内方案设计,并导入 Blender 结合 Flux 2 生成多角度渲染图,过程中用户可随时修改。

演示传递的信号不言而喻,PC 将从人手动操作软件转向智能体围绕目标调度工具,而典型案例是,Adobe Photoshop、Premiere 等应用也正为 RTX Spark 优化,并通过 MCP 接入本地智能体,成为自动化工作流的一部分。

文章配图-1

RTX Spark 只是新 PC 产品线的起点。黄仁勋还展示了三种形态:笔记本、台式机和工作站。它们共同兼容 Windows、CUDA 和 AI 软件栈,面向的使用场景各不相同。

笔记本对应移动办公、游戏和创作。

它可以本地运行 Nemotron 3 Ultra,也可以连接 Claude、Codex 或其他云端模型。台式机更像家庭里的个人 AI 主机,可以 24 小时运行智能体,连接笔记本、显示器、摄像头、安防系统、家电和其他设备。

文章配图-1

工作站面向模型开发者和智能体开发者。

DGX Station for Windows 配备 748 GB 内存、20 petaflops 算力和 8 TB 每秒内存带宽,可以在桌面环境中运行万亿参数模型。开发者可以在本地完成模型开发、调试和测试,再部署到云端。

文章配图-1

黄仁勋把这一变化类比为手机变成智能手机,打电话已经不再是今天智能手机最重要的功能。他认为,10 年后的 PC 也会经历类似变化。它会从打开应用、点击和输入的工具,变成家庭和个人工作流里的 AI 超级计算机。

文章配图-1

而我们能感受到最直接的变化,大概就是未来的 Windows 电脑,或许会是一台真正的 AI Agent 电脑。

对于想在本地跑 LLM、又需要大内存和较强 AI 算力的人来说,RTX Spark 的出现,可能会成为除 Mac 之外的另一个选项。

有用 AI 时代到来,一切为 Agent 而生

如果把过去两年的行业变化归纳为一句话,那就是有用的 AI (useful AI)已经到来。而 Agentic AI 的第一批应用场景,正是软件开发。

文章配图-1

全球有 3000 万到 4000 万职业开发者,GitHub commit 数量也在持续增长:2023 年约 3 亿,2024 年约 4 亿,2025 年前几个月达到 5 亿,2026 年前几个月接近翻了三倍。

黄仁勋借此反驳了「AI 会减少就业岗位」的说法。在他看来,AI 提高了工程师的产出,企业反而更愿意招聘更多工程师。究其原因,同样的人力成本可以创造更高生产力,软件开发的价值也会继续扩大。

更深层的变化发生在应用形态上。

过去的软件由应用、代码和操作系统组成,但智能体时代的计算方式则换了一套流程:用户给出目标,模型理解意图,运行环境调度流程,工具执行任务,记忆系统保存上下文,最后产出结果。

整个过程包含观察、理解、推理、规划、行动和工具调用。

文章配图-1

在这个框架下,LLM 只是 Agentic 系统中的「思考模块」。完整的智能体还需要 harness,也就是调度和编排层;需要浏览器、电子表格、数据库、编译器、CAD 软件和数据处理引擎等工具;也需要短期记忆、长期记忆和运行环境。而这种 LLM+harness=Agent,再加工具、记忆和运行环境的模式将会是未来十年的应用基础。

智能体成为新的应用形态后,支撑智能体运行的计算底座也要重新设计。

发布会上,黄仁勋宣布,英伟达下一代 AI 超级芯片平台 Vera Rubin 已进入全面投产阶段。它是英伟达迄今规模最大的 POD 级平台之一,也是面向 Agentic AI 设计的新一代 AI 工厂核心系统。

文章配图-1

Vera Rubin 由 Rubin GPU、Vera CPU、NVLink 72、BlueField、ConnectX 9、Spectrum X 以太网、存储处理系统、安全处理系统和完整软件栈共同组成,目标是支撑 AI 工厂级别的系统运行。

它面向的是智能体从输入到执行的完整流程。

智能体处理提示词、理解上下文、推理规划、调用工具、访问数据库、运行代码和检索长期记忆时,会同时牵动 GPU、CPU、网络、内存、存储和安全系统,因此 Rubin GPU 负责主要计算,Vera CPU 负责调度和数据管线,BlueField 4 处理安全隔离与存储,Spectrum X 负责大规模联网。

Vera Rubin 之后,黄仁勋还单独讲了 Vera CPU。

在他看来,过去的 CPU 主要服务于人类用户和传统云计算租赁,计算资源按核心、按时间出租,响应速度以秒为单位衡量。但智能体的运行节奏完全不同:

它们会频繁调用工具、访问数据库、运行代码、检索记忆,每一步都要求更低延迟。

文章配图-1

这也让 CPU 在 AI 工厂里的角色变得更关键。智能体数量越多,工具调用和数据流转越频繁,CPU 越容易成为瓶颈。尤其是 GPU 已经成为 AI 工厂最昂贵的资产,CPU 的延迟和吞吐会直接影响 GPU 利用率,最终影响 Token 产出。

Vera CPU 的设计逻辑正在于此。

过去 CPU 为人服务,Vera CPU 则面向数量远多于人类的智能体。它采用自研 Olympus Core,重点放在单线程性能、核心间带宽、总带宽和能效。它有神经分支预测器、10 路解码引擎、大型乱序执行引擎和先进预取机制。内存部分采用 LPDDR5X,并支持多错误校正。

文章配图-1

这颗 CPU 包含 88 个 Olympus 核心,使用单片网格结构连接,没有把核心分散到多个 chiplet 上。这样的设计减少了跨芯片通信带来的延迟。它支持 PCI Express Gen 6,内部通信能力达到 3.6 TB 每秒,内存带宽达到 1.2 TB 每秒。

相比 x86 CPU,Vera 在部分场景中峰值内存延迟降低 40%,智能体 sandbox 性能达到 1.8 倍,SQL 性能达到 3 倍,实时流处理性能达到 6 倍。

Agent 是新的工作负载,CPU 的角色也随之变化。它不再只是云计算里可出租的通用核心,而是 AI 工厂里调度模型、工具、内存、数据库和安全系统的关键部件。

现在买电脑,是用来打造 AI 工厂

黄仁勋反复强调,AI 的商业逻辑已经改变。过去算力常被视为成本,现在 token 是可以带来收入的单位。只要 token 能产生收入,算力就成了生产能力。

文章配图-1

想用 Token 赚钱,就来看看英伟达的 AI 工厂。NVIDIA DSX 是构建并运营 AI 工厂的蓝图与参考设计,基于 Omniverse,用数字孪生提前模拟 AI 工厂的布局、电力、冷却、网络和系统集成。

黄仁勋提到,未来 1 GW 级 AI 工厂的投资可能达到 500 亿、600 亿美元,甚至进一步上升到 800 亿至 1000 亿美元。资本成本越高,系统上线速度、吞吐效率、可靠性和生命周期越关键。

文章配图-1

RTX 面向我们的 GPU,DGX 面向我们的系统,而如今,DSX 则构成了整个基础设施的核心。

而 NVIDIA DSX 这套生态系统囊括了一大批的云服务公司和 AI 基础设施企业,包括 CoreWeave、Nebius、Nscale、Naver Cloud 等,以及服务的客户包括 Cursor、World Labs、Revolut、Shopify、Google 等等,帮助所有的企业用户用 Token 来获得收入。

硬件之外,企业如何真正用上智能体,是另一条线。

黄仁勋把企业构建智能体所需能力分为四类:模型、调度系统、工具与技能、运行环境。对应到产品上,就是 Nemotron、OpenShelf、CUDA X libraries 和 AI 平台。

文章配图-1

Nemotron 3 Ultra 是此次发布的新开放模型。它采用 SSM 状态空间模型与 MoE 混合专家架构,目标是让模型跑得更快、推理成本更低。

文章配图-1

按照现场说法,相比其他开放模型如 Kimi K2.6、Qwen 3.5 和智谱 GLM 5.1,它速度提升 5 倍,整体运行成本降低约 30%。

黄仁勋还提到,Nemotron 3 Ultra 模型、训练脚本和训练数据都会开放,企业可以在此基础上加入自己的行业数据和专有知识。

文章配图-1

演讲尾声,黄仁勋把全场内容重新收回到一个核心模式:模型、harness、工具、技能和运行环境。

文章配图-1

这套模式可以运行在云端,也可以运行在企业本地;可以运行在 PC 上,也可以运行在汽车、机器人、卫星、通信基站、工厂和边缘设备上。不同场景会使用不同模型、不同 harness、不同工具和不同 runtime,但计算模式是相同的。

云端需要 Vera Rubin 和 AI 工厂。PC 需要 RTX Spark 和 Windows 智能体平台。企业需要 Nemotron、OpenShelf 和 CUDA X 工具链。汽车需要 Alpamayo、Hyperion 和自动驾驶 runtime。人形机器人需要 Isaac Groot、Thor、仿真和数据生成系统。

当我们把整场演讲连起来看,将近两个小时的超长发布,黄仁勋讲的主题已经超出常规新品发布。

文章配图-1

AI PC 和 RTX Spark 面向个人设备,把智能体带到用户桌面和家庭。Vera Rubin 面向数据中心,承接大规模智能体负载。Vera CPU 解决智能体调用工具和访问数据时的延迟问题。

DSX 面向 AI 工厂建设,把电力、冷却、网络和运维也纳入系统设计。Nemotron、OpenShelf 和 CUDA X libraries 面向企业智能体开发。Cosmos 3 把智能体推进物理世界。Alpamayo 2 和 Hyperion 面向自动驾驶,Isaac Groot 则把人形机器人也放进同一套平台逻辑。

NVIDIA 过去最核心的身份是 GPU 供应商,后来变成系统公司,现在又试图成为 AI 基础设施公司。

黄仁勋在这场大会想讲清楚的,也正是这件事: AI 竞争已经从模型扩展到一整套计算体系,覆盖个人电脑、企业软件、数据中心和物理设备。

本文来自转载APPAPP ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
资讯组小编的头像资讯组小编
Codex 500万用户福利被怼“作秀”!Claude Code 吃掉近九成 Token,OpenAI 抢用户败在“小气”上?
上一篇 7小时前
10万亿!中国正成为AI基建狂魔
下一篇 4小时前



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论