马斯克旗下xAI加入“世界模型”竞赛,“视觉模型”会是下一个“大语言模型”吗?
创始人
2025-10-12 21:51:56
0

本文作者:龙玥

来源:硬AI

人工智能领域的战火正在从大语言模型蔓延至一个更前沿的领域——能够理解并模拟真实物理世界的“世界模型”(World Models)。而xAI已悄然加入这场竞赛,与谷歌和Meta等科技巨头同台竞技。

据英国《金融时报》10月12日报道,马斯克的初创公司xAI在今年夏天从芯片巨头英伟达聘请了人工智能专家,专门从事世界模型的研发。与依赖文本的大语言模型不同,世界模型通过对海量的视频和机器人数据进行训练,旨在掌握真实世界的物理规律。

“未来的视频模型将变得和语言模型一样智能”,谷歌研究人员在论文中说道。英伟达上月也曾表示,世界模型的潜在市场规模可能接近当前全球经济的总量。

兵马先行:xAI的游戏“奇袭”与机器人野望

为了在这场竞赛中占据一席之地,xAI正在积极招兵买马。

公司已聘请了来自英伟达的两位AI研究员Zeeshan Patel和Ethan He,他们在世界模型领域拥有丰富经验。英伟达凭借其用于创建和运行模拟的Omniverse平台,一直是该技术的领导者。

知情人士透露,xAI为世界模型规划的第一个商业化落点是游戏领域,用于生成可交互的3D环境。这一动态迅速引发市场关注,因为它不仅是xAI商业化路径的明确信号,也凸显了世界模型作为下一代AI技术的巨大潜力。

马斯克本人也在社交平台X上确认,xAI将在“明年年底前发布一款出色的AI生成游戏”。长远来看,这些技术最终可能应用于机器人的人工智能系统。

xAI的招聘信息也印证了其发展方向。公司正在为其“omni团队”招聘图像和视频生成领域的技术人员,薪资范围高达18万至44万美元,该团队致力于“创造超越文本的神奇AI体验”。

此外,公司还在以时薪45至100美元招聘“视频游戏导师”,以训练其AI模型Grok制作视频游戏。

范式转移:视觉模型的“GPT时刻”

xAI的高调入局,恰逢一个关键的行业预判浮出水面:未来的视频模型将变得和语言模型一样智能。谷歌最近的一篇论文指出,其视频模型Veo 3正展现出与大语言模型(LLM)相似的“涌现能力”。

正如LLM通过“下一词元预测”的简单任务,最终学会了数学和创意写作等额外技能,视频模型通过“下一帧预测”,也开始零样本(zero-shot)地解锁一系列令人惊讶的能力,例如物体分割、边缘检测和模拟工具使用等,而这些都未经专门训练。

谷歌的研究人员Jack Clark在论文中写道:“我们认为,正如自然语言处理(NLP)从特定任务模型转向通用模型一样,机器视觉领域也可能通过视频模型发生同样的转变——一个‘视觉领域的GPT-3时刻’。”

他们将视频逐帧生成的过程类比为语言模型中的“思维链”(chain-of-thought),并称之为“帧链”(chain-of-frames),认为这使得视频模型能够跨越时空进行推理。

这一发现意义深远,它暗示着通过发展更智能的视频模型,人们或许能够获得能力极强的机器人“代理”(agent)。

前景与现实:高昂的成本与“愿景”的缺失

尽管前景诱人,但通往世界模型的道路并非坦途。目前,该技术仍面临巨大的技术挑战,其中最主要的是为模拟真实世界寻找和处理足够训练数据的成本极其高昂。

与此同时,业界也存在对AI作用的冷静审视。热门游戏《博德之门3》的开发商Larian Studios的发行主管Michael Douse本周在X上表示,AI无法解决游戏行业的“大问题”,即“领导力和愿景”。

他补充说,行业需要的不是“更多由数学方式生产、经过心理学训练的游戏循环”,而是对世界更多样化的表达。这代表了一种普遍的观点:纯粹的技术突破本身,并不能保证创造出能够真正打动人心的商业产品。

尽管挑战重重,但xAI的入局无疑为世界模型的竞赛再添一把火。

AI的焦点正不可逆转地从纯粹的数字信息处理,转向对复杂物理现实的模拟与交互。视觉模型是否能复刻大语言模型的辉煌,迎来属于自己的“GPT时刻”,不仅将决定下一代AI霸主的归属,更可能重塑我们与数字及物理世界的根本关系。

相关内容

热门资讯

中国外贸出现历史性反转:进口增... 2026年前4个月,中国货物贸易进出口总值16.23万亿元人民币,同比增长14.9%。 大部分媒体的...
泰格医药董事长、总经理被立案调... 5月13日,国内临床CRO(合同研究组织)龙头企业泰格医药(300347.SZ,03347.HK)发...
“卖一度电,亏一度电” !广西... 来源:第一财经 2026.05.14 本文字数:4873,阅读时长大约8分钟 作者 | 第一财经 ...
成都向国际友城发布125个先进... 5月14日,作为2026成都国际友城合作与发展大会的重要活动之一,经济与贸易投资对话会在成都世纪城国...
标普纳指又新高,思科飙涨13%... 科技股强势领涨推动美股周四再创历史新高,零售销售数据符合预期进一步巩固市场信心,美股指续创新高,原油...
A股“股王”副总经理被刑事拘留 来源:市场资讯 (来源:法治营商环境) 风头正劲的A股“股王”源杰科技,突然宣布副总经理因刑拘被解...
布米普特拉北京投资基金管理有限... 美国最新通胀数据高于预期,正在重塑市场对美联储利率路径的判断。交易员周二进一步削减了对任何降息的押注...
原创 S... 太空狂人马斯克,正准备在资本市场掀起滔天巨浪。他旗下太空探索技术公司SpaceX,即将迎来一次具有里...
AI热潮催生2026最大IPO... AI热潮仍在持续点燃华尔街。 美东时间14日周四,被视为“英伟达挑战者”的AI芯片公司Cerebra...
揭秘涨停 | 18股封单均超1... 截至今日(5月14日)收盘,上证指数报收4177.92点,下跌1.52%;深证成指收于15745.7...
华虹公司一季度净利润增超五倍,... 这一轮AI(人工智能)周期中,存储芯片受益显著。而A股大多存储封装或存储模组厂商,少有真正的存储晶圆...
江城区:以企业联络员制度优服务... 为深入推进《江城区2026年工业行动年实施方案》落地,持续优化营商环境,5月12日,阳江市江城区召开...
4月新增贷款转负,增速放缓或将... 来源:滚动播报 (来源:北京商报) 5月14日,人民银行发布2026年4月金融统计数据报告。4月末,...
听说国家要盘活艺术品市场,我劝... 读完那篇“2030年九大措施盘活艺术品市场”的宏大蓝图,我差点以为自己明天就能靠家里那几个破盘子破碗...
宁波惠康工业科技股份有限公司首... 特别提示 宁波惠康工业科技股份有限公司(以下简称“惠康科技”或“发行人”)首次公开发行3,708.7...
深度 | 奢侈品牌将不再相信二... 每一家奢侈品门店都必须重新证明自己的回报 作 者 | Drizzie 奢侈品牌曾经渴望向更多城市...
美参议院批准凯文·沃什出任美联... 当地时间13日,央视记者获悉,美国国会参议院当日以54票赞成、45票反对的投票结果,正式批准凯文·沃...
白酒板块久违“吸金”!成交额创... 来源:财联社 财联社5月14日讯(编辑 梓隆),今日(5月14日),白酒板块迎来久违的热度修复,截至...
突发!17个小时谈判破裂!三星... 三星电子劳资第二轮事后调解13日最终破裂,工会宣布将如期启动总罢工。这恐将造成40万亿韩元(约合人民...
白酒行业遇冷,为何今世缘能稳住... 出品|中访网 审核|李晓燕 白酒行业的深度调整期,像一场大浪淘沙的试炼。当不少酒企陷入增长停滞、渠道...