马斯克发布「最强大模型」超越 DeepSeek,成本高出 200 多倍
创始人
2025-02-18 16:05:51
0

「聪明得可怕」,这是马斯克预告 Grok 3 时的说法,以至于今天一大早,全网都在苦苦等待。

在全网蹲点发布会时,App Store 先一步更新了。而在发布会进行过程中,Grok 网页版也一度火到崩溃。

可以,看着很有信心的样子。

Grok 3 不是一个简单的产品迭代,在此之前,是马斯克大手笔建设的数据中心、豪气的显卡配置,采用最佳的预训练模型并继续使用强化学习进行训练,堪称「富养」出来的新一代。

要点提炼如下:

  • 美区账号已经可以更新,英区、欧洲 2.28 推出
  • 推出 SuperGrok 高级订阅计划,月费为 30 美元,年费为 300 美元,提供额外的推理和 DeepSearch 查询功能,包含了无限量的图像生成服务
Grok 3 推理能力领先 DeepSeek R1

在 Chatbot 竞技场之称的 LMSYS 盲测中,Grok 3 在代码、指令响应等各个方面排名第一。

作为诞生于 20 万张显卡的产物,Grok 3 断层级别的表现依旧证明了 Scaling Law 仍在生效。

相比于 DeepSeek 以低成本创造高收益,Grok 3 主打一个「大力出奇迹。」

这次,引入推理能力的 Grok 3 的重点在于更灵活地进行实时计算资源分配,在保证推理质量的同时,最聪明的使用计算资源。

曾经 Grok 2 的推理能力,就已经达到过当时的 SOTA 水平。在经过多次迭代之后,模型的泛化能力有大幅提升。Grok 3 在最新的 AIME 竞赛中则再次刷新了自己的记录。

不过,仅仅只是推理能力强显然是不够的,快、狠、准才能参与大模型内卷。发布会现场,工程团队展示了两个案例。

一个是请求生成一个从地球发射到火星并返回地球的 3D 动画代码,Grok 思考了 19 秒,详细描述了其思考过程,包括使用 Python 进行绘图,以及使用 NumPy 进行计算。

另一个则是试图让 Grok 将《俄罗斯方块》和《宝石迷阵》这两款游戏结合起来,创造出一个新的游戏。

很遗憾,Grok 一上来就遭遇了连续两次的翻车,连马斯克回头看了屏幕上糟糕的演示环节,也不免尴尬地发出了一句「oh man」。

不过,后续演示中,也端上了正常的案例(该不会准备好的 demo 吧)。

而一些幸运的网友已经玩上 Grok 3 了。

▲图片来自 X 网友 @jesselaunz

DeepSearch 登场,要革搜索引擎的命

作为这次更新的重磅产品,Grok 3 加持的 DeepSearch 号称是下一代搜索引擎。模型将自主像 agent 一样运作,并且理解用户提问背后的意图,省下在 Google 花的时间。

现场展示的环节里,工程师给 Grok 3 出了一道有趣的题:预测 NCAA 「疯狂三月」的胜负数,也就是所有层级里的比赛结果。

这是巴菲特在 2014 年发起的一个活动,赌注高达十亿美元,赌得就是让巴菲特破产。历史上无人成功,甚至无人接近,因为即使专家预测,前几轮后也会出现大量错误。

▲2023 年 NCAA 对阵图

当年这就是一个营销活动,毕竟赢下的概率之小,几乎是千千亿分之一的概率,基本等于不可能。把这个问题甩给Grok 3,不可谓不大胆。

返送的答案中,除了援引的材料,还做了结构化处理。开头介绍、背景知识、分析图表、总结陈词,相当完整。

检索的重点在于,如何交叉核实各个信息源。Grok 3 通过设计一个子任务面板来完成这个工作,用户可以自己实时监测正在进行的任务,从而保证答案是可用的、可靠的。

在这个基础上,agent 自主检索十分钟,抵掉自己摸索一小时,才是有效减少工作量。

最终 Grok 3 也给出了它认为的 2025 年 NCAA 冠军,三月还没来,让我们拭目以待它的「神预言」会不会成真。

至于 Grok 3 的体验方式,官方说了,X 的 Premium+ 订阅用户将率先体验,而其他高级功能则被纳入 xAI 推出的新计划——SuperGrok 中。

SuperGrok 的月费为 30 美元,年费为 300 美元,仅提供额外的推理和 DeepSearch 查询功能,还包含了无限量的图像生成服务。

贾维斯来了?还没完全来

就在昨晚,Shivon Zilis 路透了她和有 Grok 3 加持的人工智能助理 Ara 的对谈,并称这是生命中最意想不到的收获。

简直是徒增大家对语音模式的期待,马斯克在发布会召开前就已经宣布语音模式只会在一周内推出,这也意味着无缘演示环节。

不过,在现场直播环节,马斯克也表示这将是 Grok 最好的体验之一,在发布会的尾声,语音模型也放出了一个男声,听着倒是挺有人味的。

这一点点的路透,激起了极大的好奇,到了QA环节关于语音模式的提问涌上来。当然,还有现在必不可少的灵魂拷问:「开源否」我们节选了一部分

QA

问:Grok 语音模式什么时候推出;是基于文本转语音,还是能理解人类说话并直接回应的模型?

答:Grok 基本上会理解人类所说的话,将首先在一周内发布早期版本,后续将迅速进行迭代更新。

问:什么时候推出 Grok API?

答:将在接下来的几周内推出,包含推理模型和深度研究功能。

问:Grok 能记住互动的谈话内容吗?

答:正在努力开发这个功能,不过目前还没有完全完成。

问:是否还会开源 Grok 模型

答:当 Grok 3 成熟稳定之后,大概几个月将会开源 Grok 2。

问:做这个项目最困难的部分是什么?

答:最大的挑战是让整个模型在海量的 H100 上进行训练,并保持一致性

相关内容

热门资讯

每周股票复盘:杭州银行(600... 截至2026年5月22日收盘,杭州银行(600926)报收于16.05元,较上周的16.51元下跌2...
深圳企业2026年展厅设计公司... 好的,请查收根据您的需求创作的深度文章。 引言 深圳,作为中国的“创新之都”和科技前沿阵地,其企业在...
2026年北京海淀公寓出售市场... 海淀区作为北京科技与教育高地,其公寓出售市场正经历结构性调整。随着城市更新与产业外溢,区域内在售公寓...
雪龙集团研发投入2020.36... 雪龙集团(603949)披露2025年年度报告。报告期内,公司全年研发投入达2020.36万元,同比...
6949万元,5.6折!恒大一... 恒大海上威尼斯酒店今日(5月23日)完成拍卖。 京东资产交易平台信息显示,位于启东市寅阳镇的恒大海上...
机构:604万枚比特币面临潜在... 按量子安全(份额)划分的比特币供应量,其中30.2%面临风险 来源:Glassnode 上证报中国...
原创 游... 瑞鹤仙这个绰号,在民间股神圈子里提起来,谁都认。他1984年湖北出生,上海名校毕业,游戏公司上过班。...
渣打CEO就AI替代“低价值”... IT之家 5 月 23 日消息,渣打银行首席执行官比尔 · 温特斯(Bill Winters)就其有...
严子怡刷新女子标枪亚洲纪录、世... 新华社厦门5月23日电(记者吴俊宽、刘旸)2026世界田联钻石联赛厦门站23日在厦门白鹭体育场进行,...
十年亏损仍激进扩张,埃夫特10... 在抛出收购意向近四个月后,国产机器人厂商埃夫特(688165.SH)正式落地对盛普股份的并购计划。近...
6万股民无眠!4家A股公司,终... 来源:市场资讯 (来源:券研社) 大家好,今天是周六,一起看下市场主要消息面。 昨日晚间,*ST熊猫...
原创 8... 一家成立不到五年的公司,以582亿元年营收叩开深交所大门,创下河南企业IPO历史纪录。 5月22日,...
美股芯片股深夜大涨,富途暴跌近... 当地时间5月22日,美股三大指数集体上涨,道指涨0.58%,报50579.70点,刷新历史新高;标普...
深圳可行性研究报告——研发类项... 项目名称:深圳可行性研究报告——研发类项目可研报告:别把“可行性”写成“先进性” 编制单位:深圳思创...
原创 油... 【阅读须知】:本文内容所有信息和数据,均为作者查阅官方信息和网络已知数据整合解析,旨在让读者更清晰了...
原创 俞... 01 先说"为什么有这个话题" 俞浩最近真的太有争议地火了,先是被兽爷评价为流量恐怖主义,后俞浩自己...
对话王小川:离开通用人工智能的... “如果没有转型,继续走主流道路,你也会有同等程度的焦虑。”王小川说,这次转型,让他真正回归到从创业第...
国际金价与油价何去何从? 注:本文的简略版发表于《人民日报》客户端“零时差”栏目,2026年5月23日,转载请注明出处。文中配...
今夜,原油暗盘跳水!美伊谈判,... 【导读】周末好消息 中国基金报记者 泰勒 大家周末好,给你们说件美伊谈判的利好消息,有了不错的进展!...
原创 超... 自从美伊冲突爆发,全球能源交易的齿轮发生了剧烈咬合,一个被西方长期忽视的真相正逐渐浮出水面。 SWI...