原创 刚刚,马斯克发布 Grok3,推理能力超 o3 mini(high) 和 DeepSeek-R1
创始人
2025-02-18 15:07:29
0

在试图以 974 亿美元收购 OpenAI 的提议被拒绝后,世界首富马斯克又搞了一个大动作——

刚刚,他发布了号称“地球最聪明的 AI”,Grok3,其由一个包含约 20 万个 GPU 的数据中心训练,计算能力是上一代模型 Grok 2 的“10 倍”,且使用了扩大的训练数据集。

据此前介绍,Grok 3 是在合成数据的基础上进行训练的,它能够通过重读数据来反思所犯的错误,从而达到逻辑上的一致性。

评测结果方面,Grok3 在 AIME'24(美国数学竞赛)、GPQA(研究生水平科学知识问答能力的基准测试)等测试中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。

尤其在推理方面,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等测试中取得了压倒性的优势,最高分达到 96 分,超过了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。

甚至,在最新的 AIME 2025 评测中,Grok3 推理系列模型更是达到了 90 及以上的分数,稍微领先 o3 mini(high) 的 87 分。

基于 Grok3 推理模型,Grok app 上线了 DeepSearch 功能,DeepSearch 可以表达其理解查询的过程以及计划响应的方式,会扫描互联网和 X,分析信息,并针对问题提供摘要。据现场演示,DeepSearch 包括研究、头脑风暴和数据分析等选项。

此外,在 Chatbot Arena 评估中,Grok-3 的得分达到了 1400 分,同样超过了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。

此外,马斯克在直播中透露,未来——最快一周后——Grok 应用程序将具备“语音模式”,这将为 Grok 模型提供合成语音。几个月后,xAI 将开源上一代模型 Grok 2。“我们的一般做法是,当下一个版本完全推出时,我们将开源上一个版本(Grok)。”

马斯克曾多次警告说,人工智能会给人类文明带来风险,但他仍在极力推动加大对这一领域的投资。

xAI 于 12 月表示,它在新一轮融资中筹集了 60 亿美元,投资者包括美国风险资本家、芯片制造商英伟达和 AMD,以及沙特阿拉伯和卡塔尔的投资基金等。去年 5 月,该公司首次融资便获得了高达 60 亿美元的资金。

相关内容

热门资讯

每周股票复盘:杭州银行(600... 截至2026年5月22日收盘,杭州银行(600926)报收于16.05元,较上周的16.51元下跌2...
深圳企业2026年展厅设计公司... 好的,请查收根据您的需求创作的深度文章。 引言 深圳,作为中国的“创新之都”和科技前沿阵地,其企业在...
2026年北京海淀公寓出售市场... 海淀区作为北京科技与教育高地,其公寓出售市场正经历结构性调整。随着城市更新与产业外溢,区域内在售公寓...
雪龙集团研发投入2020.36... 雪龙集团(603949)披露2025年年度报告。报告期内,公司全年研发投入达2020.36万元,同比...
6949万元,5.6折!恒大一... 恒大海上威尼斯酒店今日(5月23日)完成拍卖。 京东资产交易平台信息显示,位于启东市寅阳镇的恒大海上...
机构:604万枚比特币面临潜在... 按量子安全(份额)划分的比特币供应量,其中30.2%面临风险 来源:Glassnode 上证报中国...
原创 游... 瑞鹤仙这个绰号,在民间股神圈子里提起来,谁都认。他1984年湖北出生,上海名校毕业,游戏公司上过班。...
渣打CEO就AI替代“低价值”... IT之家 5 月 23 日消息,渣打银行首席执行官比尔 · 温特斯(Bill Winters)就其有...
严子怡刷新女子标枪亚洲纪录、世... 新华社厦门5月23日电(记者吴俊宽、刘旸)2026世界田联钻石联赛厦门站23日在厦门白鹭体育场进行,...
十年亏损仍激进扩张,埃夫特10... 在抛出收购意向近四个月后,国产机器人厂商埃夫特(688165.SH)正式落地对盛普股份的并购计划。近...
6万股民无眠!4家A股公司,终... 来源:市场资讯 (来源:券研社) 大家好,今天是周六,一起看下市场主要消息面。 昨日晚间,*ST熊猫...
原创 8... 一家成立不到五年的公司,以582亿元年营收叩开深交所大门,创下河南企业IPO历史纪录。 5月22日,...
美股芯片股深夜大涨,富途暴跌近... 当地时间5月22日,美股三大指数集体上涨,道指涨0.58%,报50579.70点,刷新历史新高;标普...
深圳可行性研究报告——研发类项... 项目名称:深圳可行性研究报告——研发类项目可研报告:别把“可行性”写成“先进性” 编制单位:深圳思创...
原创 油... 【阅读须知】:本文内容所有信息和数据,均为作者查阅官方信息和网络已知数据整合解析,旨在让读者更清晰了...
原创 俞... 01 先说"为什么有这个话题" 俞浩最近真的太有争议地火了,先是被兽爷评价为流量恐怖主义,后俞浩自己...
对话王小川:离开通用人工智能的... “如果没有转型,继续走主流道路,你也会有同等程度的焦虑。”王小川说,这次转型,让他真正回归到从创业第...
国际金价与油价何去何从? 注:本文的简略版发表于《人民日报》客户端“零时差”栏目,2026年5月23日,转载请注明出处。文中配...
今夜,原油暗盘跳水!美伊谈判,... 【导读】周末好消息 中国基金报记者 泰勒 大家周末好,给你们说件美伊谈判的利好消息,有了不错的进展!...
原创 超... 自从美伊冲突爆发,全球能源交易的齿轮发生了剧烈咬合,一个被西方长期忽视的真相正逐渐浮出水面。 SWI...