马斯克旗下xAI加入“世界模型”竞赛,“视觉模型”会是下一个“大语言模型”吗?
创始人
2025-10-12 21:51:56
0

本文作者:龙玥

来源:硬AI

人工智能领域的战火正在从大语言模型蔓延至一个更前沿的领域——能够理解并模拟真实物理世界的“世界模型”(World Models)。而xAI已悄然加入这场竞赛,与谷歌和Meta等科技巨头同台竞技。

据英国《金融时报》10月12日报道,马斯克的初创公司xAI在今年夏天从芯片巨头英伟达聘请了人工智能专家,专门从事世界模型的研发。与依赖文本的大语言模型不同,世界模型通过对海量的视频和机器人数据进行训练,旨在掌握真实世界的物理规律。

“未来的视频模型将变得和语言模型一样智能”,谷歌研究人员在论文中说道。英伟达上月也曾表示,世界模型的潜在市场规模可能接近当前全球经济的总量。

兵马先行:xAI的游戏“奇袭”与机器人野望

为了在这场竞赛中占据一席之地,xAI正在积极招兵买马。

公司已聘请了来自英伟达的两位AI研究员Zeeshan Patel和Ethan He,他们在世界模型领域拥有丰富经验。英伟达凭借其用于创建和运行模拟的Omniverse平台,一直是该技术的领导者。

知情人士透露,xAI为世界模型规划的第一个商业化落点是游戏领域,用于生成可交互的3D环境。这一动态迅速引发市场关注,因为它不仅是xAI商业化路径的明确信号,也凸显了世界模型作为下一代AI技术的巨大潜力。

马斯克本人也在社交平台X上确认,xAI将在“明年年底前发布一款出色的AI生成游戏”。长远来看,这些技术最终可能应用于机器人的人工智能系统。

xAI的招聘信息也印证了其发展方向。公司正在为其“omni团队”招聘图像和视频生成领域的技术人员,薪资范围高达18万至44万美元,该团队致力于“创造超越文本的神奇AI体验”。

此外,公司还在以时薪45至100美元招聘“视频游戏导师”,以训练其AI模型Grok制作视频游戏。

范式转移:视觉模型的“GPT时刻”

xAI的高调入局,恰逢一个关键的行业预判浮出水面:未来的视频模型将变得和语言模型一样智能。谷歌最近的一篇论文指出,其视频模型Veo 3正展现出与大语言模型(LLM)相似的“涌现能力”。

正如LLM通过“下一词元预测”的简单任务,最终学会了数学和创意写作等额外技能,视频模型通过“下一帧预测”,也开始零样本(zero-shot)地解锁一系列令人惊讶的能力,例如物体分割、边缘检测和模拟工具使用等,而这些都未经专门训练。

谷歌的研究人员Jack Clark在论文中写道:“我们认为,正如自然语言处理(NLP)从特定任务模型转向通用模型一样,机器视觉领域也可能通过视频模型发生同样的转变——一个‘视觉领域的GPT-3时刻’。”

他们将视频逐帧生成的过程类比为语言模型中的“思维链”(chain-of-thought),并称之为“帧链”(chain-of-frames),认为这使得视频模型能够跨越时空进行推理。

这一发现意义深远,它暗示着通过发展更智能的视频模型,人们或许能够获得能力极强的机器人“代理”(agent)。

前景与现实:高昂的成本与“愿景”的缺失

尽管前景诱人,但通往世界模型的道路并非坦途。目前,该技术仍面临巨大的技术挑战,其中最主要的是为模拟真实世界寻找和处理足够训练数据的成本极其高昂。

与此同时,业界也存在对AI作用的冷静审视。热门游戏《博德之门3》的开发商Larian Studios的发行主管Michael Douse本周在X上表示,AI无法解决游戏行业的“大问题”,即“领导力和愿景”。

他补充说,行业需要的不是“更多由数学方式生产、经过心理学训练的游戏循环”,而是对世界更多样化的表达。这代表了一种普遍的观点:纯粹的技术突破本身,并不能保证创造出能够真正打动人心的商业产品。

尽管挑战重重,但xAI的入局无疑为世界模型的竞赛再添一把火。

AI的焦点正不可逆转地从纯粹的数字信息处理,转向对复杂物理现实的模拟与交互。视觉模型是否能复刻大语言模型的辉煌,迎来属于自己的“GPT时刻”,不仅将决定下一代AI霸主的归属,更可能重塑我们与数字及物理世界的根本关系。

相关内容

热门资讯

技术创新成“突围”路径 沪市光... 当前,沪市光伏行业龙头“反内卷”正处于进行时。通过技术创新提供更具竞争力、高品质、差异化产品,成为龙...
A股“开门红”创10年新高 3... 来源:21世纪经济报道 21世纪经济报道特约记者 庞华玮 10月9日,国庆节后A股“开门红”。在资源...
青岛海陆建设公司高层调整:7名... 泰山财经记者 丁一凡 泰山财经记者获悉,由青岛市国资委全资控股的海陆建设(青岛)有限公司(简称“海陆...
原创 杜... 杜兰特一夜之间损失超过6000万美元,迅速冲上全美热搜。事发缘由令人震惊——昨日比特币突然暴跌,而杜...
股市必读:石头科技(68816... 截至2025年10月10日收盘,石头科技(688169)报收于197.79元,下跌2.47%,换手率...
原创 1... 第四版一元人民币上,印有两位女孩的形象,其中一位是侗族姑娘石奶引。她因其出众的容貌,曾被一位著名美术...
比特币又跳水,加密货币全网爆仓... 来源:市场资讯 (来源:每日经济新闻) 在经历了10月10日晚间的大跳水行情后,加密货币市场情绪仍未...
黄金猛涨,实探水贝!1克跳涨5... 近日,国际金价走强,黄金饰品消费市场也备受关注。 10月12日,记者来到国内最大的黄金珠宝集散地——...
上海人力资源市场:劳务派遣经营... 在上海这座经济活力澎湃的国际大都市,劳务派遣作为一种灵活的用工方式,在企业用工配置中扮演着重要角色。...
原创 中... 中方在稀土出口上有了新动作,出台了新的稀土出口管理规定,这让美国和欧洲都坐不住了。 德国方面说,现在...
6个重磅消息来袭,关于A股的! 1、中芯国际、佰维存储两融折算率恢复。 大致内容:中芯国际和佰维存储的融资融券折算率分别被上调至70...
国民养老保险再次寻“金主”,养... 养老险公司管理的是老百姓的“养老钱”,其稳健经营是重中之重。在人口老龄化背景下,增资、引战投,养老险...
中国移动发布 2026 年终端... 来源:IT之家 10 月 11 日,在 2025 年中国移动全球合作伙伴大会期间,中国移动举办泛全联...
今年产业规模预计破万亿,上海如... 近年来,中国生物医药产业发展进入了一个全新阶段:既保持着高速的研发和临床试验增量,还在由传统引进向自...
沪指3900点下的基金“众生相... 基金业绩分化严重。 近日,上证指数时隔十年再度站上3900点整数关口。回望这十余载,基金市场呈现出鲜...
全球风险资产再度回调,A股需要... 国庆假期后两个交易日,A股市场走势波动较大。周四,沪指时隔十年重返3900点关口;周五,主要指数高位...
印度、土耳其家庭黄金财富:增值... 【本轮贵金属牛市,印度和土耳其家庭财富因黄金增值,影响各异】在本轮贵金属大牛市中,除金融市场黄金多头...
工信部征集制造业企业融资需求,... 制造业企业融资支持又有新动作。日前,工信部办公厅发布《关于征集制造业企业融资需求的通知》(下称《通知...
两部门:治理价格无序竞争 维护... 人民财讯10月9日电,国家发展改革委、市场监管总局近日发布关于治理价格无序竞争维护良好市场价格秩序的...
【投融资动态】科友半导体A++... 证券之星消息,根据天眼查APP于10月8日公布的信息整理,哈尔滨科友半导体产业装备与技术研究院有限公...