老黄亲送马斯克“雷神之锤”!英伟达个人超算今日开售,2 万多元买个“本地 OpenAI”回家?
创始人
2025-10-16 17:54:09
0

作者 | 木子、高允毅

“集体上云”爆火之后遇到了诸多挑战,而一种全新趋势悄然抬头:把云上的 AI 能力,拉回每一位开发者的桌面。

那个 “把云上 AI 能力拉回桌面”的个人 PC,现在要来了!

据英伟达消息,DGX Spark 的本质,是把原本只存在于数据中心的 DGX 超级计算架构,浓缩成“一台能放在桌上的个人 AI 超级计算机”

有意思的是,在第一批 DGX Spark 交付名单中,还出现了正在搞星舰测试的 马斯克,而且他的这台由黄仁勋本人带机赴星舰基地,亲手转交。

图源:英伟达官网新闻稿

为此,老黄还开玩笑说:

想象一下将最小的超级计算机运送到最大的火箭旁边。

马斯克也写下一段寄语:

From a single spark,A world of intelligence!

To Jensen, Ad astra!

(由一束火花,点燃智慧的世界!致黄仁勋,奔向星辰!)

图源:英伟达官网新闻稿

1新鲜测评:这款个人 AI 超算厉害在哪儿?

DGX Spark 是在今年 3 月的英伟达 GTC 大会上官宣的,号称 世界上最小的 AI 超级计算机,大小与 Mac mini 差不多。

除了 DGX Spark,英伟达还在 GTC 大会上官宣了它的“大哥”DGX Station,也是一款个人 AI 超级计算机。不过据英伟达官方新闻,DGX Station 将于今年晚些时候由华硕、戴尔、惠普等英伟达的制造合作伙伴推出。

DGX Station定位高端桌面级大模型训练与企业级工作负载,是“个人集群节点级”的重型设备。而本文的“主角”DGX Spark则面向轻量级本地推理与微调,更加便携 。

那么,这台个人 AI 超算的实用效果如何?

一家叫 LMSYS 的组织提前拿到了 DGX Spark,并展开深度测评。LMSYS 是一家非营利组织,专注于孵化开源项目和研究;起源于 2023 年由加州大学伯克利分校、斯坦福大学、卡内基梅隆大学等多所大学合作项目。

LMSYS 的测评显示,DGX Spark 在运行 8B~20B 级的中小型模型时,性能大于等于同价位独立显卡平台,尤其在批处理(batching)+ 框架优化配合下吞吐表现稳定,批处理效率也高。

对于 70B 以上的模型,DGX Spark 的表现是可运行,但属于“可用级”而非“生产级”,更适合加载测试、兼容性研究。

关于 DGX Spark 的使用效果,LMSYS 还放出了 一段完整的“DGX Spark 本地 AI 工作站流程演示”

整体逻辑是:从启动模型 → 优化推理 → 通过 API 调用 → 接入界面 → 接入 IDE → 变成完整本地 AI 开发环境。

第一步:是测试 DGX Spark 能否像云服务器一样“一键上线模型服务”?这里的重点不在于模型能不能运行,而在于 DGX Spark 是否可以像云端一样,以服务形式常驻运行。

测试者首先通过 Docker 启动了 SGLang(SGLang 是 LMSYS 开发的一个专为本地大模型推理优化的高性能框架,能提供 OpenAI 接口形式的 API 服务),并直接加载 Llama 3.1 8B 模型。

结果显示:一条命令执行完毕之后,模型就常驻在本地端口等待调用,也就说 DGX Spark 此刻不只是 GPU,而是“本地 AI 节点”。

第二步:测试者启用了 Speculative Decoding(EAGLE3),这是目前高效推理框架正在使用的加速技术。如果 DGX Spark 只是能跑模型而缺乏调度和优化能力,这一步就会失败。

测试结果显示,DGX Spark 可以流畅启用该机制,吞吐效率明显提升,说明它不仅能运行模型,还支持推理加速策略。

第三步:测试者通过标准的 OpenAI API 格式(/v1/chat/completions)请求本地端口,DGX Spark 返回了完整 JSON 格式回复。

这一步非常关键:它证明 DGX Spark 不是执行一次性脚本,而是能以“API 服务”的方式对外提供模型能力,本质形态已经接近云端 ChatGPT 的调用体验。

第四步:在此基础上,测试者接入了 Open WebUI。只需要在浏览器里输入地址,就能像访问 ChatGPT 网页那样与本地模型对话。

整个交互过程中不经过云,不需要账号,也无延迟抖动,也就是说 DGX Spark 不只是“算力盒子”,而已经是一个“类 ChatGPT 本地对话终端”。

也就是说,DGX Spark 不只是能让你跑模型,还能直接成为“离线版 Copilot / Cursor 开发环境”,形成一个完整的个人 AI 工作流。

LMSYS 的测试证明,DGX Spark 最强的地方不是算力有多猛,而是它 能在桌面上像“个人版 ChatGPT 服务器”那样一直开着,随时被浏览器、应用或编程工具调用,就像你自己拥有了一个本地的 OpenAI

据英伟达消息,DGX Spark 基于全新 NVIDIA GB10 Grace Blackwell(GB10)超级芯片,这是让 Spark 成为“桌面级 DGX 节点”的关键。

GB10 不是一块普通 GPU,而是把 CPU 和 GPU 直接“焊成一颗芯”,共享同一块 128GB 统一内存,让大模型可以一次性加载进系统里跑,不用再受显存限制,也不用来回搬数据——换句话说,它把“只有数据中心 DGX 里才有的算力架构”塞进了一台桌面机器里。

2“统统上云”遇到了哪些问题?

英伟达发布桌面级 AI 超算,也是 AI 由云转本地“反向迁移”的一个具体表现。

过去几年,“上云”几乎是 AI 行业的共同信仰。2020 到 2023 年,被认为是“云算力独大”的时代:模型训练、推理、数据存储与应用部署几乎全部在云端完成。那时的逻辑很简单:GPU 昂贵,本地算力薄弱,而云可以“即开即用”。

然而,到了 2025 年,热潮背后的一些问题开始浮出水面:比如昂贵的 GPU 租赁、隐私风险与网络瓶颈等等。

首先,云变贵了:推理成了新的成本黑洞。

在 2020 年代初期,云计算让 AI 公司几乎“租”到了无限算力。OpenAI、Anthropic、Cohere 等都依赖 AWS、Azure 或 Google Cloud 的 GPU 集群。

但当模型进入商业化阶段后,推理(inference) 成为新的成本中心——这是每天都要发生的动作,而云 GPU 按秒计费、带宽与出站流量另算,账单像雪球一样滚大。

InfoWorld 形容这种现象是“云端最隐蔽的烧钱机器”。

项目管理平台 Basecamp 的母公司 37signals 就曾发现年度云账单高达 300 万美元,最终决定“下云”,自建机房。另一家合规平台 EasyAudit AI 则遭遇更直接的冲击:CEO Christian Khoury 坦言,“我们看到账单从每月 5000 美元一夜飙到 5 万美元——推理就是新的云税。”

随着推理量级激增,成本失控成为普遍现象。于是,许多公司开始把部分推理迁移到客户本地节点或边缘服务器,甚至与硬件厂商合作开发“本地加速器”。这不是理念转变,而是经济现实的选择。

另外,本地也变强了:设备性能不再是瓶颈。

在 2025 年的 AI 生态中,桌面不再只是输入终端,而正在重新成为“计算现场”。

The Verge 称这是“一场算力回归个人设备的革命”。

多家厂商与分析机构判断:未来训练主要在数据中心,但推理正外溢到设备与边缘。越来越多的企业客户也在自建 GPU 节点,以获得更低成本和更高合规性。对他们来说,本地不是怀旧,而是控制力的回归。

还有值得一提的是,AI 应用变了,像是从后台工具转变为了实时伙伴。

AI 不再只是文本生成或图像处理,而正深入语音助手、视频生成、工业控制、AR/VR 等实时场景。

这些应用对延迟极其敏感:几百毫秒的网络往返就足以让体验崩塌。

因此,越来越多公司把实时推理下放到端侧和边缘节点,只让云端负责训练与汇总。

这种“近端计算”的扩散,让 AI 真正变成分布式系统:云是“大脑”,本地是“手脚”,端侧是“神经末梢”。

在 AI 快速发展的时代,云端依然是大热门;不过正如英伟达的个人 AI 超算,或许正在为另一种选择打开窗口——让开发者有机会在自己的桌面上掌控算力、部署模型,并决定 AI 运行的位置和方式。

对于把“把云上 AI 能力拉回桌面”的 AI 超算,你怎么看?

参考链接

https://blogs.nvidia.com/blog/live-dgx-spark-delivery/?utm_source

https://lmsys.org/blog/2025-10-13-nvidia-dgx-spark/

相关内容

热门资讯

辽宁黑水镇一4岁女童失联,救援... 10月15日,辽宁朝阳市建平县黑水镇二分地村,一名4岁女孩丁一失联。据寻人启事,女孩身高98cm,体...
与领航者同行!WAVE2025... 2025年,全球泛互联网(泛互)行业正见证一场巨变。 一方面,尽管欧美⽇韩是泛互商业化的核⼼市场,但...
曹德旺回应辞职 10月16日晚间,曹德旺在接受采访时表示:“我八十岁了,(该)退休了。”“我是想,退下来对福耀更有好...
雀巢拟裁员1.6万人 来源:上观新闻 瑞士雀巢公司16日说,计划在今后两年内削减约1.6万个工作岗位,相当于其员工总数的6...
股票行情快报:科美诊断(688... 证券之星消息,截至2025年10月16日收盘,科美诊断(688468)报收于7.68元,下跌1.16...
瀚天天成更新招股书:前5个月营... 瑞财经 王敏 10月14日,据港交所披露,瀚天天成电子科技(厦门)股份有限公司(以下简称:瀚天天成)...
南宁八菱科技股份有限公司202... 本公司及董事会全体成员保证信息披露的内容真实、准确、完整,没有虚假记载、误导性陈述或重大遗漏。 一、...
福耀玻璃董事长曹德旺辞职 长子... 10月16日晚间,上交所上市公司福耀玻璃发布公告称,董事长曹德旺因推动福耀玻璃治理结构战略性优化与可...
《餐饮门店巡店攻略:从细节到策... 餐饮行业巡店是店长、加盟商、督导必不可少的功课。尽管现在有一些智能巡店系统,但亲自巡店仍然是管理者了...
大唐发电(00991.HK)发... 大唐发电(00991.HK)发布公告,公司已于2025年10月15日完成了“大唐国际发电股份有限公司...
阿维塔与京东零售签署合作协议,... 瑞财经 王敏 10月15日,据阿维塔官微消息,阿维塔科技与京东零售签署合作协议,双方将围绕汽车全渠道...
关税突发!A股超4000家下跌... 贸易摩擦不确定性没有消除,特别是昨晚美国财长贝森特强调稀土管控的剧烈分歧,市场愈发谨慎,资金观望情绪...
雷军最新演讲!汽车安全是基础,... 10月16日,小米集团创始人兼CEO雷军今日在2025世界智能网联汽车大会上表示,小米汽车产品上市一...
对话世界黄金协会研究负责人:今... 来源:第一财经 尽管黄金今年已创下45次历史新高,但期货市场的投机性持仓、净多头头寸尚未达到历史峰值...
共青团中央直属基金会与途虎养车... 为更加深入了解青年人才在创业及就业过程中遇到的问题和现实需求,10月14日,共青团中央直属单位——中...
中证A500ETF,上市一周年 来源:新浪基金 2024年10月15日,首批发行的中证A500ETF(159338)正式登陆交易所开...
上新!央行10月31日发行20... 人民网北京10月16日电 (记者罗知之)据中国人民银行网站消息,中国人民银行定于2025年10月31...
恒铭达等上市公司密集启动回购计... 本报记者 陈红 10月15日晚间,苏州恒铭达电子科技股份有限公司(以下简称“恒铭达”)发布回购股份报...
市场波动加大,红利的防守价值备... 近期市场波动为何放大? 近期市场波动加大,核心原因有以下三点: 一是市场自身的交易情绪达到较为极致的...
节后外资和融资资金回流市场 节后外资和融资资金回流中国市场,ETF流入明显,内外资共同加仓电子和有色金属。市场成交活跃,交易热度...