京东将发动数十万人给机器人“当老师”,打造全球最大具身智能数据采集中心
创始人
2026-05-25 07:21:35
0

与算力、模型等类似,数据采集正在成为一门生意。

在宿迁市湖滨社区,全职妈妈吴雪莲戴上京东自研的JoyEgoCam头戴设备——整机220克,内置推理单元与车规级IMU(车用惯性测量单元)。她擦桌子、叠衣服、整理收纳,设备实时记录其上肢轨迹、力度分布等。这些数据经过上传、质检、标注,将成为“燃料”输入具身智能模型。

这不是特例。在养老院,护工们记录协助老人起身、喂药、康复训练等照护动作;在田间地头,农人们采集农事操作中的手眼协调轨迹、农具握持与操作的力学数据、田间不规则地形下的行走与避障动作等。

他们都有一个共同身份:具身智能数据采集员。

5月20日,全国首个具身智能数据采集社区正式投入运行。这是继3月宣布建设全球最大具身数据采集中心之后,京东在数据基础设施方面落地的重要节点。

一个中心、若干社区点

今年3月,京东宣布建设全球最大的具身智能数据采集中心,将发动数十万人参与数据采集——包括内部超过10万名各类职业员工,以及外部50万名各行业人员。

数采中心选址在刘强东的老家——江苏宿迁。此前,京东已在这里布局了全国客服中心、淮海经济区仓储物流中心等14个项目,累计投资超200亿元。

“区位上,宿迁地处长三角北翼,交通便利;人力上,当地劳动力充足,适合大规模灵活用工,方便快速组建采集队伍;政策上,地方政府在场地、审批等方面提供了支持,数采中心项目从签约到运营,仅用40天时间。”京东科技相关负责人解释说。

这一项目2025年9月立项启动,同年10月第一期投产使用,2026年仍在陆续升级扩建,目前占地约4000平方米。据了解,在整个物理布局上,宿迁数采中心呈现“一个中心、若干社区网格”的格局。

位于湖滨新区的京东机器人数据采集中心承担场景模拟、动作捕捉、数据标注、真机验证等专业功能。譬如在场景模拟区,设置有物流仓储、医疗健康、家庭生活等场景,现场采取遥操及Ego(第一人称视角)并行的方式进行数据采集。

实验室之外,还有若干个“社区网格”采集点。采集员头戴专门的设备,以兼职或者全职的方式,在居家、产线等各类环境下,完成日常劳动即可产出数据。

在湖滨社区,全职妈妈吴雪莲头戴设备,边干家务边采集数据。

“数采的工作时间灵活,也能让居民多一份收入。我们会提供岗前培训,确保他们顺利上手。”宿迁市湖滨社区党支部书记宗家庄说。

目前,京东具身智能数据采集业务覆盖物流仓储、工业制造、健康医疗、家庭服务、城市运维等多个核心场景。根据其规划,要在两年内采集超1000万小时的优质数据,成为全球最大的具身智能数据公司。其中,在宿迁将发动超10万市民参与,覆盖家庭、办公室、工厂、物流、商店等细分场景。

在京东机器人数据采集中心,工作人员教机器人当收银员并拣货。

关于外界关心的隐私问题,京东方面回应,入户采集需要与被采集人及其家属签署保密与合规协议,数据处理过程中采用加密措施和权限管控,数据交易环节也经过监管咨询,以合规方式进行。

为什么要“养”数据?

京东为什么要花这么大成本,在物理世界里“养”数据?

答案在AI产业的底层变化中。今年以来,行业呈现出几大趋势:技术从“问答生成”向“任务代理”进化,领地从“网络空间”向“物理世界”迈进,路径从“技术竞赛”向“商业落地”转身。

不同的AI故事持续涌现。以字节跳动、阿里巴巴等为代表的互联网公司,延续了移动互联网时代的策略——争夺“超级入口”,通过豆包、通义千问等APP将AI嵌入搜索、推荐、内容生成等高频场景。这条路径较为轻量化,可快速获得用户规模。

京东则选择了另一条路。它的业务带有重资产属性,覆盖零售、物流、健康、工业、外卖、家政等场景,共同特点是都存在于物理世界。这意味着,京东的AI从起点就必须重点解决真实环境中的问题。

同样地,这也是京东切入数据采集赛道的底子。

当前具身智能面临数据荒,训练具备通用泛化能力的具身模型,至少需要数千万小时的真实场景数据,而当前全球高质量实操数据仅有数十万小时。

有缺口,就意味着机会。据行业媒体不完全统计,国内已有超27个城市在具身智能数据采集基础设施上积极布局,建设不下54座具身智能机器人数采中心、创新中心、训练场。

京东选择加入竞争,在AI产业链中建立差异化定位。“我们打造的是一套全链条体系,从数据采集、云端平台,到数据清洗标注、模型训练、数据评测以及具身智能模型研发,最终落地应用到具身本体。”京东相关负责人表示。

当然,数据采集并非没有挑战。成本控制、质量标准化,以及长期就业结构影响,都是需要持续回答的问题。

以就业为例,京东目前在宿迁已带动大批居民成为采集员,涵盖全职妈妈、退休人员、大学生等群体。但机器人未来是否会替代人——这一问题也在被讨论。“让机器人学习人的这些东西,不是为了替代,而是为了更好地去服务人,做一些重复性强、单调或危险系数高的工作,比如救灾或各类苛刻条件下的作业场景。”京东云相关负责人回应。

事实上,不光在具身智能产业,这一问题在整个AI领域都被反复讨论。经济学家卡尔·贝内迪克特·弗雷在《技术陷阱》中曾提醒:技术替代的关键,在于社会能否为受影响者提供平滑的过渡通道。转岗培训、终身学习体系,以及数据采集等新业态创造的就业缓冲带,都是必须纳入考量的方向。

数据资产的商业化

与算力、模型等类似,数据采集正在成为一门生意。

京东采集的数据有三个主要去向:训练自己的具身模型;通过数据交易平台与机器人公司、科研机构合作;面向学术界开放部分高精数据集,推动前沿研究。

目前,京东已与数十家企业建立战略合作,国内具身智能企业帕西尼就是其中之一。它与京东云的合作主要在两个层面:一是依托京东云平台进行自身数据集的推广销售和模型训练;二是拿到京东的Ego数据样品,交由算法团队测试。

值得注意的是,行业对“什么数据最有价值”仍在探索。有业内人士指出,现阶段的关键在于数据的多样性与规模,训练具备泛化能力的具身模型至少需要数千万小时量级数据,未来几年内数据采集依旧十分重要。

京东的策略与之对应:覆盖尽可能多的场景,从物流仓库到家庭厨房,从商超货架到田间地头。这种“广度优先”的策略,目标是让模型建立对物理世界的通用理解。

在田间,农人通过头戴设备,边工作边采集数据。

“具身模型训练和大模型训练类似。预训练阶段主要靠多样化数据,让模型具备一定的泛化能力;之后通过强化学习或后训练,用针对某一类场景的遥操数据,来提升模型在特定任务上的表现。”京东云相关负责人解释。

在业内人士看来,国内具身智能数据采集正在经历“基础设施化”,成效取决于几个变量的相互作用:采集效率能否持续提升,数据质量能否稳定达标,以及下游的模型与应用能否形成正向反馈。

在产业处于早期的当下,这些问题还没有确定答案。但可以肯定的是,谁能在数据层建立起规模优势,谁就更有可能在接下来的产业竞争中占据主动。

相关内容

热门资讯

刚刚!SpaceX上市,马斯克... 来源:市场资讯 (来源:雷科技) 北京时间22:00,马斯克旗下的SpaceX正式登陆美股纳斯达克,...
巴黎23岁边锋不满欧冠决赛替补... 据天空体育报道,布拉德利·巴尔科拉对未能入选巴黎圣日耳曼的欧冠决赛首发阵容感到失望,如果转会费达到预...
中国人民银行拟出台大额存单管理... 新华社北京6月12日电(记者任军、吴雨)中国人民银行6月12日发布《大额存单管理办法(征求意见稿)》...
6/12财经夜宵:得知基金净值... 写在文章前的声明:在本文之前的说明:本文中所列的投资信息,只是一个对基金资产净值进行排行的客观描述,...
践行两会精神l天士力锚定新质生... 2026年3月5日,十四届全国人大四次会议在北京开幕,政府工作报告为医药健康产业擘画清晰蓝图:生物医...
刚刚,人类有了第1个万亿富翁,... 就在今晚, SpaceX 正式上市,开盘价初步显示高达 156.93 美元/股,较之前公开募股价 1...
北京朝阳区打造全国企业出海专业... 央广网北京6月12日消息(记者 王进文)当中国企业扬帆出海、逐鹿全球,高水平对外开放的浪潮奔涌向前。...
全球资本市场史上最大IPO,S... 全球资本市场史上最大规模IPO(首次公开发行)来了。北京时间6月12日晚,埃隆·马斯克旗下的美国太空...
史上最大IPO,SpaceX上... 全球资本市场史上最大规模IPO(首次公开发行)来了。北京时间6月12日晚,埃隆·马斯克旗下的美国太空...
美国消费者信心从历史低位反弹 ... 财联社6月13日讯(编辑 牛占林)随着汽油价格回落,美国消费者信心在6月初自历史低位反弹,但中东冲突...
盘前:航天概念股整体走高 纳指... 来源:环球市场播报 随着美国和伊朗即将达成结束战争协议的消息进一步发酵,全球股市和债市持续反弹,油...
看懂AI趋势,打造个人不可替代... 2026年,AI已经不是一个概念,它实实在在地改变了工作、产业和每个人的处境。要看清趋势,两件事绕不...
马斯克为SpaceX上市敲钟:... 北京时间6月12日晚间,世界首富埃隆·马斯克旗下的太空探索技术公司SpaceX(SPCX)正式敲钟上...
划定“80%红线”,风格漂移纳... 来源:21世纪经济报道 21世纪经济报道特约记者 庞华玮 公募基金行业迎来一项重要新规——主题投资基...
原创 原... 谁能想到呢?那个在歌坛舞台上高音如洪钟、震撼全场的韩红,其实在相声圈里有着令人肃然起敬的身份——按辈...
高盛总裁沃尔德伦:SpaceX... IT之家 6 月 12 日消息,北京时间今晚,SpaceX 正式开盘交易,上市首日高开 29% 跻身...
格隆汇公告精选︱丰元股份:拟投... 【热点】 索辰科技(688507.SH):物理AI业务目前尚处于布局初期 富信科技(688662.S...
险资投资“南向通”债券,开闸! 市场关注已久的险资参与债券通“南向通”,正式落地。 券商中国记者从行业多方了解到,近期,中国人寿、平...
欧洲电力供应竞争加剧,客户付费... 来源:滚动播报 全球三大燃气轮机制造商之一的西门子能源公司表示,欧洲为数据中心和电气化项目争夺电力供...
TVB持续加码内地布局:在深圳... 每经记者:黄婉银 每经编辑:董兴生 爆款IP成为拉动企业发展的重要引擎,《新闻女王》系列的火爆让电视...