马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文
创始人
2024-03-29 15:16:22
0

原标题:马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文

机器之心报道

编辑:泽南

马斯克搞大模型,速度也奇快。

Grok 1 开源才刚有 10 天,Grok 1.5 就来了。

本周五早上,马斯克旗下的人工智能公司 xAI 正式推出了 Gork 大模型的最新版本 Grok-1.5。新一代模型实现了长上下文理解和高级推理能力,计划将在未来几天内向早期测试人员和 X 平台(前 Twitter)上的现有 Grok 用户提供。

上周一,马斯克刚刚开源了 3140 亿参数的混合专家(MoE)模型 Grok-1。通过开源 Grok-1 的模型权重和网络架构,Gork 项目已展示了 xAI 截至去年 11 月所取得的进展。在最新模型 Grok-1.5 中,Gork 又有了进一步提高。

能力与推理

Grok-1.5 最明显的改进之一是其在代码和数学相关任务中的性能。在 xAI 的测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中的竞赛问题。

此外,它在评估代码生成和解决问题能力的 HumanEval 基准测试中得分为 74.1%。

还记得昨天 Databricks 开源的通用大模型 DBRX 吗?当时的对比图表如下所示,看起来新版本 Grok 的提升是显著的。

就是不知这个大幅升级的 1.5 版会在什么时候开源?

长上下文理解

Grok-1.5 中的另一个重要升级是在其上下文窗口内可以处理多达 128K token 的长上下文。这使得 Grok 的容量增加到之前上下文长度的 16 倍,从而能够利用更长文档中的信息。

此外,该模型可以处理更长、更复杂的提示(prompt),同时在上下文窗口扩展时仍然能保持其指令跟踪能力。在大海捞针(NIAH)评估中,Grok-1.5 展示了强大的检索能力,可以在长度高达 128K token 的上下文中嵌入文本,实现完美的检索结果。

训练 Grok-1.5 的基础设施

xAI 进一步介绍了用于训练模型的算力设施。在大规模 GPU 集群上运行的先进大型语言模型(LLM)研究需要强大而灵活的基础设施。Grok-1.5 构建在基于 JAX、Rust 和 Kubernetes 的自定义分布式训练框架之上。该训练堆栈允许开发团队能够以最小的精力构建想法原型并大规模训练新架构。

在大型计算集群上训练 LLM 的主要挑战是最大限度提高训练作业的可靠性和正常运行时间。xAI 提出的自定义训练协调器可确保自动检测到有问题的节点,并将其从训练作业中剔除。工程师还优化了检查点、数据加载和训练作业重新启动等问题,以最大限度地减少发生故障时的停机时间。

展望

为了寻求替代微软支持的 OpenAI 和 Google 大模型的解决方案,马斯克去年推推动了 AI 创业公司 xAI,以创建他所说的「最大程度寻求真相的人工智能」 。去年 12 月,这家初创公司为 X 的 Premium+ 订阅者推出了 Grok。

xAI 表示,Grok-1.5 很快就会向早期测试者开放,其团队将继续改进 Grok。随着新版本推向公众,在未来几天 X 上的大模型将陆续推出一些新功能。

参考内容:

https://x.ai/blog/grok-1.5

https://www.reuters.com/technology/musks-xai-launch-improved-version-chatbot-2024-03-29/

相关内容

热门资讯

不停产,抢抓市场窗口期 来源:福建日报 这个春节,位于清流氟新材料产业园福宝片区的福建中欣氟材高宝科技有限公司(以下简称“中...
原创 吃... 前言 没有国家的培育,就没有企业的快速崛起,尤其在AI这类核心科技领域,企业的成长离不开政策、数据...
无锡企业做微信商城小程序?本地... 无锡企业做微信商城小程序?本地制作公司搭建,方案定制更省心 无锡企业选微信商城小程序制作公司,第一个...
原创 要... 2026年2月20日,一场重大的政策变动在美国总统特朗普宣布的一项贸易新规中揭开了序幕。特朗普总统依...
兴业证券:美关税判决是行政权受... 智通财经获悉,兴业证券发布研报称,2月20日,美国最高法院以6:3裁定美国对等关税和对华芬太尼关税违...
快速认识 BSCI审核整改要求... 理解BSCI审核整改要求,其核心在于把握其设计所遵循的底层逻辑。这一逻辑并非简单的条款罗列,而是基于...
一男子试图闯入特朗普私宅,被击... 央视新闻消息,央视记者获悉,美国特勤局2月22日称,特勤局特工在美国总统特朗普位于佛罗里达州西棕榈滩...
通胀数据居高不下,预计美联储将... 来源:环球市场播报 美联储最青睐的一项通胀指标最新读数显示,12 月份物价依然黏性偏高,这可能使美联...
“守护节日 护航市场”濮阳市场... 按照春节假期“守护节日 护航市场”行动部署,全市市场监管系统深入商场超市、集贸市场、旅游景区、高速公...
关税战未奏效,美国商品贸易逆差... 参考消息网2月20日报道据美国《华尔街日报》网站2月19日报道,尽管特朗普政府为缩小贸易逆差而加征了...
马年投资锦囊|华商基金邓默:看... 深圳商报·读创客户端记者 陈燕青 春节长假后A股将迎来马年的交易时段。展望马年市场,华商基金量化投资...
民企这一年|上上电缆董事长丁山... 编者按: 2025年2月17日,一场聚焦民营经济发展的高规格座谈会在京召开,习近平总书记出席并发表重...
化工板块,好起来了?机构看好周... 景气度下滑多年的化工板块,渐渐有了起色。 受困于价格下行、资本开支增加等,化工板块2021年开始进入...
德媒:全球股市面临日本债市波动... 参考消息网2月22日报道据德国《世界报》网站2月8日报道,几十年来,日本在金融市场上一直被视为“沉睡...
原创 曾... 编辑:[沙尘暴] 在贺兰山脚下,坐落着一座不起眼却分量十足的城市——石嘴山。这座扎根西北戈壁滩的城市...
原创 不... 中国减持美债的节奏越来越稳 中国持有的美国国债规模这些年一直在往下走,这不是什么新鲜事,但最近的动作...
柳絮纷飞 敏感人群如何防护? 春夏交替,柳絮纷飞,也是哮喘高发季。那么问题来了,过敏体质该如何低成本、有效避开高危过敏原?今年5月...
“全球大模型第一股”道歉!称“... 本文自南都。 采写 | 南都N视频记者 林文琪 2月21日,“全球大模型第一股”智谱AI(02513...
原创 马... 就在这两天,整个汽车圈又被特斯拉的一条实测视频给刷屏了。 特斯拉的官方账号在欧洲、中东和非洲发了一段...
原创 炸... 炸锅!美国突然终止一系列关税,不是妥协是换招?150天临时关税来袭,中美贸易博弈再升级 当地时间2月...