消费级显卡就能跑!雷军公布小米机器人最新进展:真机运行画面首曝
创始人
2026-02-12 17:10:39
0

快科技2月12日消息,小米又憋了个大的。

今天,雷军亲自在微博放出重磅消息,小米机器人团队正式发布并开源全新具身智能VLA模型 ——Xiaomi-Robotics-0,真机运行画面首次对外曝光

这不是一次普通的技术更新,而是小米在机器人领域的一次关键破局。47亿参数规模、兼具视觉语言理解与高性能实时执行能力,在三大主流仿真测试中横扫行业标杆,拿下全项SOTA(State-of-the-Art,即当前公开可验证的最先进、最高水平),更在真实机器人上实现流畅动作。

而最具颠覆性的是,它能在普通消费级显卡上实现实时推理,直接打破了高端机器人模型 “只能实验室跑、普通人用不起” 的魔咒,这也是其区别于同类产品的核心亮点之一。

很多人好奇,现在的机器人模型,到底卡在哪了?

行业里藏着两个多年未解决的核心痛点:

第一,推理延迟高、动作不连贯:传统 VLA(Vision-Language-Action,视觉 - 语言 - 动作)模型虽然参数规模可圈可点、泛化能力较强,但在真实物理世界中,庞大的推理延迟让机器人像 “延迟卡顿的木偶”,动作断断续续,根本没法像人一样自然操作,被网友调侃为 “反应迟钝的木头人”;

第二,硬件门槛极高:稍微具备高性能的模型,必须依赖昂贵的专业显卡才能正常运行,普通开发者、小团队根本碰不起,导致先进技术只能被锁在实验室,无法落地普及。

在此基础上,还有一个普遍难题。不少模型 “仿真测试成绩好看,一上真机就拉胯”,无法在现实世界里稳定完成叠毛巾、拆积木这类真实物理任务,形成理论与实操脱节的尴尬。而小米这次的 Xiaomi-Robotics-0,就是冲着解决这些行业顽疾来的。

官方明确表态:“今天,我们对外发布:Xiaomi-Robotics-0。这是一个拥有 47 亿参数、兼具视觉语言理解与高性能实时执行能力的开源 VLA 模型。它不仅在三大主流的仿真测试中获得优异成绩,更在现实真机任务中实现了物理智能的泛化 —— 动作连贯、反应灵敏,且能在消费级显卡上实现实时推理”。

这句话精准概括了模型的核心优势,尤其要强调,不用高端计算设备,不用斥巨资购买专业显卡,普通消费级显卡就能让它稳定跑起来,这也是小米此次最具突破性的成果之一,直接拉低了具身智能技术的落地门槛。

能做到这一点,核心是小米自研的Mixture-of-Transformers(MoT)混合架构,通俗说就是给机器人装了 “双脑协同系统”,兼顾决策与执行效率。

一个是视觉语言大脑(VLM),负责听懂人话、看懂环境,哪怕是 “把毛巾叠好” 这种模糊指令,也能精准理解空间关系和任务目标,保留了VLM本身的多模态理解能力,这是此前很多VLA 模型所不具备的优势;

另一个是动作执行小脑(DiT),专门负责把指令变成丝滑动作,生成连续流畅的 “动作块”,再通过流匹配技术保证精准稳定,让机器人告别机械卡顿,动作接近人类的灵活度,从根源上解决了传统模型动作断层的痛点。

为了让机器人既聪明又能干”,团队还设计了两阶段训练方案。

先通过跨模态预训练,让模型在学动作的同时,不丢失物体识别、视觉问答等基础能力,避免 “练了手工、废了脑子”,同时通过 Action Proposal 机制让VLM的特征空间与动作空间对齐,为后续实操打下基础。

再通过后训练优化,用异步推理模式从机制上解决真机 “动作断层” 问题,搭配 Clean Action Prefix 让动作轨迹连续不抖动,通过 Λ-shape Attention Mask 让机器人聚焦当前视觉反馈、摆脱历史惯性,哪怕环境有小变化,也能即时调整,大幅提升环境适配能力。

分拣不同颜色的积木

将大块积木逐步拆成小块

将毛巾摊平-叠好

主动将多余毛巾放回以进行叠放

从这次曝光的真机视频里就能直观感受到,处理毛巾这种软塌塌的柔性物体,它会先铺平、再对折、整理整齐,多余的毛巾还会主动放回原位。

面对刚性积木,它能一步步稳妥拆解,手眼协调极其稳定,不会出现卡顿或失误。不管是软质材料还是硬质物件,都能从容完成,这就是物理智能真正落地的直观表现,也是小米此次突破的核心价值所在。

在 Libero、Calvin、SimplerEnv 三大全球主流具身智能测试集里,Xiaomi-Robotics-0 对标超过 30 款主流模型,在所有基准测试中全部拿下SOTA,用实打实的数据坐稳行业第一梯队,真正实现了 “仿真通、真机强、多模态能力不丢失” 的突破。

比技术更强的是小米的格局:这次成果直接全量开源—— 技术主页、GitHub开源代码、Hugging Face模型权重全部公开,全球开发者都能免费使用、二次开发,相关资源可在各大平台直接获取,彻底打破了大厂对具身智能核心技术的垄断。

这意味着,原本高高在上的具身智能技术,第一次真正向行业敞开大门,不再是大厂专属玩具,普通开发者也能参与其中,加速整个行业的技术迭代。

雷军也在微博中透露,小米早已深度布局机器人赛道,目前仍在全球招募顶尖人才,团队还在持续冲刺下一代技术,此次发布的 Xiaomi-Robotics-0 只是阶段性研究成果,未来还会有更多突破。

当机器人不再是卡顿的演示道具,而是动作流畅、反应灵敏,还能在消费级硬件上轻松跑起来的真实产品,那个 “家用机器人走进千家万户” 的未来,真的离我们越来越近了。

相关内容

热门资讯

国际金价持续走弱 多家银行调整... 中新网北京6月25日电(记者 谢艺观)近期,国际金价持续下跌,失守4000美元心理关口,引发市场关注...
公正司法筑根基 丹法护航优营商... “法治是最好的营商环境,也是企业安心经营的底气,藏在每一次高效立案、每一场公正审判、每一回善意执行里...
“河以幸福”四川站系列采访报道... 文丨欧阳新华 蒲飞 王相川 在大多数中国人的地理记忆里,四川是长江的四川,是岷江的四川,是都江堰的四...
宁德时代 在柳州成立新能源公司 天眼查App显示,近日,时代骐骥新能源科技(柳州)有限公司成立,法定代表人为曾凡清,注册资本500万...
存储芯片+MCU芯片+AI芯片... A股收盘 【上证指数涨0.23% 存储芯片板块走高】四大股指今日集体收涨,上证指数报收4120.28...
“超级供应链”发力!这类机器人... 来源:市场资讯 (来源:央视财经) 在数智化浪潮的推动下,中国工业品采购市场正经历一场深刻的结构性变...
坐不住了?坚守茅台的前千亿基金... 【大河财立方 记者 孙凯杰】坐不住了?这或许是近期不少持仓基民对前“千亿基金经理”刘彦春的真实疑问。...
国际金价跌破4000美元后重返... 现货黄金价格在周三跌破4000美元关口后,周四再度短线拉升。 6月25日晚间,现货黄金短线拉升近50...
谷歌前CEO批评中国AI开源:... 今天,谷歌前CEO批评中国AI开源的一条上了热搜。视频中,谷歌前CEO埃里克·施密特在一个论坛对话环...
“60岁父亲背8个鸡蛋接考”的... 湖南60岁父亲背着8个土鸡蛋接高考儿子的视频,曾感动了无数网友。6月25日,全网牵挂的这位被接考少年...
中国白酒最坏时刻已经过去!白酒... 6月25日,A股市场白酒股集体拉升,其中, 酒鬼酒(000799.SZ)10CM涨停, 水井坊(60...
黄金避险神话破灭?“死叉”临近... 黄金的市场逻辑正在经历根本性转变。曾经支撑金价屡创新高的地缘政治溢价与避险叙事已悄然退场,美联储政策...
中钨在线:光伏钨丝和PCB微钻... 中钨在线6月25日消息称,钨市整体弱稳运行,原料端长单以外有效成交不多,贸易商议价重心承压,市场普遍...
原创 宁... 矿权性质能否变更留悬念。 作者 | 姚悦 编辑丨于婞 来源 | 野马财经 2024年底,锂电行业寒冬...
“龙大转债”倒计时不足一月,S... 图片来源:视觉中国 蓝鲸新闻6月25日讯(记者 代紫庭)6月25日,ST龙大(002726.SZ)披...
华数传媒在温州成立新公司 天眼查App显示,近日,温州华数传媒科技有限公司成立,法定代表人为潘劲勇,注册资本1000万人民币,...
锦艺新材创业板IPO获受理:A... 6月24日,深交所官网显示,苏州锦艺新材料科技股份有限公司(以下简称“锦艺新材”)创业板首次公开发行...
资本明星SK海力士赴美上市 来源:滚动播报 (来源:北京商报) 站上万亿美元市值后,韩国半导体龙头SK海力士已提交美国IPO申请...
上海未来产业基金出资2家GP 投资界6月25日消息,根据上海未来产业基金公示,投资决策委员会近期审议通过拟参与投资以下2只子基金:...
4300只个股下跌!A股三大指... 6月25日,A股三大指数开盘涨跌不一,早盘冲高回落后,又再度震荡拉升,随后集体翻红。黄白线分化明显,...