马斯克掀桌子了,最强开源大模型诞生!Grok-2近万亿参数性能首曝
创始人
2025-08-24 11:18:56
0

新智元报道

编辑:YHluck

【新智元导读】Grok-2正式开源,登上Hugging Face,9050亿参数+128k上下文有多猛?近万亿参数「巨兽」性能首曝。马斯克再现「超人」速度,AI帝国正在崛起。

什么?马斯克终于开源了Grok-2!

一大早,xAI正式官宣,向所有人开源Grok-2!

马斯克还预告,Grok-3将在6个月后开源。

Grok-2于2024年完成训练,体积超500GB。其混合专家(MoE)架构在Grok-1的基础上进行了改进

那Grok-2到底开源了哪些部分?开源版本的技术特点是什么?开源权限有什么?

我们为你一一梳理了下,上干货:

开源了什么?

xAI本次向所有用户开源了Grok-2以下核心部分:

  1. 模型权重

  2. 模型架构

Grok-2开源版本技术特点

这个开源的「大脑」拥有非常强大的技术规格:

巨大的模型规模总参数量高达9050亿905B,在推理时,每次会激活其中的1360亿136B参数。这使它成为目前最强大的开源模型之一。

超长的上下文窗口支持高达131,072 (128k) token的上下文长度。

这意味着它可以一次性阅读和处理非常长的文档或对话历史(大约相当于一本200多页的书),进行更复杂的推理和总结。

混合专家架构 (MoE):这种架构可以在不增加巨大计算成本的前提下,大幅扩展模型规模,提升模型能力。

较新的训练数据:其预训练数据覆盖了大量的文本和代码,截止到2024年初

Grok-2和Grok-1架构不同点,网友对此做了一个总结:

开源权限是什么?

商业用途门槛仅当关联公司年收入低于一百万美元时,才可用于商业用途。超过此门槛的商业用途需获得xAI的单独许可。

限制:除非本协议条款允许对Grok 2进行修改或微调,否则不得使用材料、衍生品或输出(包括生成的数据)来训练、创建或改进任何基础、大型语言或通用人工智能模型。

目前,Grok-2现已正式开源,可在Hugging Face上下载。

HF地址:https://huggingface.co/xai-org/grok-2

使用方法:通过SGLang部署

下载权重文件

你可以把/local/grok-2替换成任意你喜欢的文件夹名称。

hfdownload xai-org/grok- 2--local-dir /local/grok- 2

下载过程中你可能会遇到一些错误,请多次重试直到下载成功。

如果下载成功,该文件夹下应包含42个文件,总大小大约为500GB。

启动服务器

安装最新版的SGLang推理引擎(版本≥v0.5.1),地址:

https://github.com/sgl-project/sglang/

使用以下命令启动推理服务器。这个检查点(checkpoint)配置为 TP=8,所以需要8张GPU(每张显存大于40GB)。

python3 -m sglang .launch_server--model/local/grok- 2--tokenizer-path/local/grok- 2/tokenizer .tok.json--tp8--quantizationfp8 --attention-backendtriton

发送请求

这是一个经过额外训练的模型,所以需要使用正确的对话模板。

python3 -m sglang.test.send_one --prompt "Human: What is your name?<|separator|>\n\nAssistant:"

你应该能看到模型输出名字——Grok

大佬点评

网友XFreeze称,xAI发展的速度极其惊人!

他透露,xAI位于孟菲斯的巨像数据中心仅用122天建成并全面投入运营,配备100,000块英伟达H100 GPU。

「短短两年内,xAI凭借Grok 4的发布,以极其精简的团队登顶全球最强人工智能之巅。」他感叹道。

黄仁勋曾称,这是「超人」之举,只有马斯克能做到!

在人工智能发展进程上,有网友毫不吝啬地赞美马斯克和xAI:他们正以光速推动AI的进步。

他还预告,Grok 5训练即将开始。

有网友感叹道,92天内将容量翻倍,这不是资本分配带来的结果,而是一种绕过传统使用一种新的运营策略带来的。

有网友表示,这一切,就像在实时观看一个科幻梦想成真——真正达到了创新的巅峰!

Grok 4发布会上,马斯克曾预告了下一步路线图——

8月将发布编码模型,9月发布多模态智能体,10月发布视频生成模型。

xAI模型能飞速迭代,主要背靠了强大的超算中心。预计5年内,xAI将打造出5000块H100巨无霸超算。

老马自信满满地表示,「xAI很快就能干掉谷歌以外的所有对手,就连谷歌,超过它也是迟早的事」。

真是有点期待,下一个AI帝国诞生了。

参考资料:

https://huggingface.co/xai-org/grok-2

相关内容

热门资讯

重庆银行招标结果:重庆银行20... 证券之星消息,根据天眼查APP-财产线索数据整理,重庆银行股份有限公司12月30日发布《重庆银行20...
FPG财盛国际:贵金属开盘大行... ●FPG最新市场脱水消息: 1. 彭博社指出,尽管交易员认为在美国进一步降息、美元走弱的背景下,贵金...
港股异动丨金风科技大涨超14%... 金风科技大涨超14%,报15.33港元。消息面上,蓝箭航天科创板IPO申请获受理,根据金风科技202...
原创 美... 这几天,美国又开始蠢蠢欲动,似乎在准备与中国再次爆发贸易冲突。具体来说,美国贸易代表办公室公布了对中...
复盘2025!公募基金四大痛点... 编者按:2025年,随着一系列改革举措加速落地见效,公募基金行业的高质量发展成色持续提升。岁末年初,...
2025年含“港”权益基金 4... 2025年行情收官,含“港”权益基金业绩成绩单出炉。 数据统计显示,截至2025年12月31日,在可...
原创 中... 2025年5月,美国代表在日内瓦的谈判桌上突然改变了态度,开始提倡务实沟通,而且手里紧握着求和的剧本...
贵州茅台成立新公司“爱茅台” 1月2日,记者查询企查查发现,贵州爱茅台数字科技有限公司已于2026年1月1日成立,注册资本6亿元,...
股价飙涨559%!又一万亿美元... 人工智能热潮为存储芯片带来强劲需求。美国存储芯片企业闪迪,自2025年2月重返公开市场以来,公司股价...
一图解码:天九企服赴港IPO ... 12月30日,天九企服向港交所递交了招股书,计划在主板挂牌上市;由建银国际和交银国际担任联席保荐人。...
原创 沐... 沐曦股份跌破上市新低!3500亿市值悬顶,估值泡沫该挤挤了 A股“打新神话”翻车现场!沐曦股份刚上市...
原创 今... 大家早上好,今天是元旦小长假的第二天,就在A股还在休市期间,港股今天开盘了,无论是恒生指数还是恒生科...
壁仞科技港股上市首日开盘涨超1... 图片来自壁仞科技官网 1月2日,“港股GPU第一股”壁仞科技挂牌交易,成为2026年A股、港股首家上...
上证深一度 | 风口之上,磷化... 自2025年三季度以来,储能行业需求呈爆发式增长,叠加国内外供应链格局调整、上游原料供应偏紧等多重因...
韩元走弱“偏离基本面”!韩国央... 韩国央行行长李昌镛表示,近期韩元走弱并未反映韩国经济的真实实力,并誓言将反对任何可能威胁外汇市场稳定...
百度:计划分拆昆仑芯业务并于香... 来源:财联社 百度港交所公告,1月1日,昆仑芯已透过其联席保荐人以保密形式向香港联交所提交上市申...
免签政策红利持续释放 入境旅游... 过去一年,中国持续扩大免签国家范围。同时,原有的72小时、144小时的过境免签政策也被统一延长到了2...
原创 全... 2025年福布斯实时亿万富豪榜又出来了,美国那边还是埃隆·马斯克稳坐头把交椅,他的身家已经飙到677...
2025年A股新股首日涨幅排行... 文/瑞财经研究院 吴文婷 2025年收官,A股新股上市首日涨幅排行榜出炉。 瑞财经根据同花顺数据梳...
中国证监会修订发布《公开募集证... 上证报中国证券网讯 据证监会12月31日消息,为落实《推动公募基金高质量发展行动方案》,进一步降低基...