衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
How time flies!又到了一年一度的618。
今年你下单了吗?抢到心仪的商品了吗?快递收得顺利不?血拼了大半个月的我有一个最大的体会,就是今年的618还是那么热闹,但有些东西变了。
你可能也注意到这些变化——
技术不是“内卷”“压榨”或“花样叙事”的工具,而是切实服务着美好生活。
体验更好,出错更少,意味着背后的技术进步得更多,也越能说明有人在背后顶住了压力。
让大家高高兴兴购物,支撑亿级用户顺利下单、收货体验的,是一群技术人,他们日复一日地在代码堆里打磨系统、调模型、压成本、提效率。
618是京东的生日,也是京东首次以线上促销形式庆祝这一日期,推出了618年中促销活动,通过限时秒杀等简单玩法吸引消费者。
一眨眼,我们已经在这个特别的时间点买买买了二十多年。
趁着这个节点,今年,我们找来了三位分别来自京东零售、物流、科技业务的技术人,聊了聊他们在幕后做的事。
长林丨零售:不是造一个新模型,而是让模型用得起、落得下
大家在京东选购商品时可能会留意到,不同商家架上的同类商品会自动被归在一起,方便大家快速对比选购性价比高的商品,商家也会被激励提供更具竞争力的价格和服务。
这背后其实是一套“同品判别系统”, 它通过对比商品的各种属性来判断两个商品是否相同,同时保证聚合展示的质量。
来自京东零售业务的长林,正在主导京东同品判别系统在大模型时代的优化。
他2021年从中国科学院自动化研究所博士毕业加入京东,一开始就在做大模型相关的工作。最开始是研究BERT等,case by case地简单修改模型架构、改造模型训练方式。
△读书时期长林和行业大佬交流
后来ChatGPT横空出世,他的研究就主要集中在模型压缩和数据自动化选择与配比上,尽可能提高模型训推效率和性能平衡,减少实际应用中的人力和实验成本。
于是,长林和团队决定转向一条更务实的路线,即模型蒸馏。
小模型学习大模型分辨的结果对错,也学习其内部思考过程,领悟判断逻辑,深入理解什么样的特征才是有用的判断依据。
最终,长林和团队把大模型的推理过程抽象成特征动态演化的过程,从而最大程度提取知识。相关成果最后被顶会ACL接收。
模型蒸馏外,数据是长林一直关注的另一要素。
在模型训练阶段,京东平台上海量商品之间的组合数量指数级增长,不可能全部喂给模型用来训练。
为此,长林设计了一套数据筛选机制,优先选出那些最有信息量、最难判断的“模糊样本”,这样不仅节省了40%~60%的训练资源,还保持了原有精度。
同时,为了支持多个任务的数据融合训练,他还引入了一种自动数据配比算法,根据不同任务的难度动态调整数据占比,进一步提升了训练效率。
以上这一整套方法,最后被用在系统审核环节。
△长林代表公司参加行业顶会
幸运的是,这种算力消耗不低的探索方向,在系统真正被验证好用之前,就得到了京东在资源和团队协作上的支持。
这种在项目推进上的自由度,让长林能够坚持自己的追求——不是堆模型参数赢比赛,而是让技术真正跑进业务、服务用户。如果能让用户更快买到“又好又便宜”的商品,提升一点点体验,降低一点点选择成本,那技术就没白用。
技术人要找到值得长期投入的课题,关键不是一头扎进算法细节,而是要深入业务,从实际问题角度出发。
而 京东与其他电商平台不同,它拥有完整的供应链体系。
“但对技术人来说也是一个挑战。”长林表示,这意味着需要在更大的搜索空间里寻优,需要更好的优化方法。
像他做的同品判别系统,就是在深入理解商品聚合场景之后,自然浮现出来的方向——既贴近用户体验,又具备模型落地的复杂性,值得长期深耕。
这就是技术真正的影响力,不是靠炫技,而是让科技以「无感」的姿态融入日常,让用户体验丝滑流畅。
长林非常鼓励更多年轻的技术同学关注这个方向,“这块未来机会很多,也值得用心去深挖。”
星衍丨物流:打透一个场景,不去追求无边界泛化
和长林差不多时间入职京东的星衍,如今已经是京东物流一个10余人技术团队的负责人了。
△读书时期的星衍
此次618物流大考前夕,星衍的日常有些“不太日常”:他带着团队每隔几小时就查看一次前线实仓的指标、现场监控和异常回报,有时还要一起亲自到实仓去。
因为他和团队面临的工程问题,80%需要现场给出的答案。
至于他为什么会选择今天这条路,故事还要从他当年在国外读博说起。
当时,星衍在Meta实习,也顺利拿到了研究岗的offer。但“那个岗位其实做的就是写SQL、跑数仓,和博士研究的时空数据分析基本没关系”,而且在星衍看来, 国外平台对技术人员的上限不够友好,是不是博士干的活都差不多,没啥挑战。
思来想去,他还是决定回国。
在横向对比了N个到手offer后,星衍决定成为一名京东人。原因很简单:
至少这里的业务场景是开放的,你想往前多做一步,是有空间的。
最终,结合自己的专业方向和技术兴趣,他选定了京东物流作为定岗方向——这是一个看起来“灰尘多、线下多、数据脏”的场景,并且是需要真正的深入业务理解业务场景,在一线、成为一线。
他每天需要考虑和接触得最多的,不是派送件的快递员,就是分拣快递的仓库。这俩一个是物流末端,面对开放环境,一个是封闭场景,复杂度不在一个纬度上,但都不简单。
星衍主导的第一个项目,是对快递终端作业模式进行重构。
以前,每个京东快递的站点,是站长靠经验来划分快递员辖区。随着快递体量越来越大,人的主观经验开始吃不消了——既有分配不均的问题,也有反馈难追踪的问题。
他印象特别深,当时做末端派送分析就发现,有的快递员明明在同一个小区送件,却要回到站点两三次。
于是,星衍带领团队 开发了一套智能分区模型,结合快递员画像 (如派件量、上楼频率、返站次数)和小区地形信息(是否老旧小区、有无电梯等),帮助末端更合理地分派人力。
时至今日,京东物流仍然在不断探索如何更好地利用数据进行优化和改进。
而星衍现在正在推动的项目,是部署在京东物流的分拣中心的机械臂,这也是为什么他最近忙得不可开交、动辄要去仓库前线的原因。
△星衍在一线
从去年开始,星衍带队负责包裹抓取与码放的智能化改造项目,落实到地就是一台台机械臂,负责完成京东仓库中部分中小件包裹的自动分拣、码放工作。
这些机械臂和传统工厂流水线上的机械臂不同,它们是“具身智能”,只不过不是通用型的。而它们和星衍团队的目标,是把“中小件包裹分拣、码放”这个单一场景打透。
为什么要强调“打透”?星衍强调,越垂直的场景,越不能追求泛化,而且这一个场景其实比想象中难太多。
具体技术上,星衍团队采用了行业成熟方案加域内微调的模式。这种情况下京东内部积累的海量包裹图像数据就立下了汗马功劳,这都是外部团队很难获得的积累。
作为博士管培生入职后,他从初来乍到的技术新人,到现在带着团队伙伴一起负责核心项目,星衍的成长速度是非常快速的, 角色的转型也是他近期的重要课题。
以前是自己调模型、改代码就行,现在是得替大家考虑怎么组织项目、解决问题。如今的星衍,比起一开始那个还带着研究视角的博士,显然多了一些“工程老兵”的理性与判断。
具体的带团队方法上,他比较反感“压KPI”的做法,更强调问题导向、协作为主。
团队项目一旦出了bug绝不推诿,遇到问题大家就挤在会议室一起想办法,“没什么面子不面子的,干活是最实在的。”
当初刚刚加入京东的时候,技术小兵初雪只是参与着科技业务一些比较底层的小模块的开发调试,比如语音活动检测、VAD、声纹日志。
乍一听这些技术非常陌生,但其实在消费者每天都接触到的应用里,都是链路里不可或缺的模块。
这些应用,在京东丰富的自有场景里迅速扎根,成长为有成千上万用户、身边朋友家人都会用到的产品。这让初雪从初入行业的技术人才,进化成熟稔产业应用的专家。
△初雪(右起第四)和伙伴们一起保障春晚红包互动
当聊到这段成长经历,初雪表示自己“晋级打怪”的速度不是个例。
他当初经由博士管培生项目招进京东,项目机制成熟:入职前半年打基础,技术大佬+业务大佬直接指导,解答技术问题的同时能够深入业务学习和建立认知,接下来就会进入项目历练,在能落地的技术实践中培养人才,利用技术眼界创造更大的价值。因为每个人都配备了导师,每个人都有清晰的成长路径。
京东在资源上也很支持,“项目落地过程中,只要你能把技术说清楚、效果做出来,公司就愿意投入。京东是一家用产业价值衡量技术的企业。”
当然,真正让他成长跳跃的,还是他在真实业务场景拼杀、口中“打仗一样”的项目经历。
初雪回忆道,某年他所在团队揽下了做会议转写系统的任务,但当时市面上已经有成熟产品了,公司内部一直有声音主张直接对外采买。但京东既坐拥丰富的产业数据,又拥有大量的场景需求。当时初雪就觉得,如果这都做不过外部竞品,那我们还有什么价值呢?
最后在多轮盲测中,自研的会议系统转写效果超过了外部头部竞品。
△初雪(右起第六)项目上线后和伙伴们一起庆祝
接下来,初雪进入了更多集团级项目的核心链路中,“资源多,场景也多。”他开始站在京东更高的视野考量技术的价值。
应用到京东的业务场景中,咱们普通人最有感知的例子或许是京东智能外呼——电话那头听起来很自然、反应灵活的拟人语音,高效处理海量呼叫任务,介绍最新产品、活动,还能理解客户需求。
针对这个必须解决的问题,初雪和团队专门收集了全国各地的大量样本,还开发了针对性增强机制,比如使用MoE来在不同方言分布之间做切换,从而实现对口音更友好的模型泛化。
除了这些,他也在推动一些更“感知层”的创新方向,比如通过分析语音中的情感、语气波动,判断用户的意图倾向是“犹豫偏正向”还是“犹豫偏负向”。
你不能只看他说了什么,还得听他说话的“感觉”。 这些看似天马行空的技术,对于外呼电话能否打动听众、品牌能否真正有效触达消费者,有着生死攸关的商业价值。
目前,这个方向还处在探索期,但初雪相信未来一定会进入更多业务环节,因为“这才是真正让AI听懂人话”。
当被问到对这份工作的认同感时,初雪停顿了一下,然后说:
从TGT出发,走一条真正属于技术人的长路我现在做的,就是让错的地方越来越少,让听不懂的情况越来越少。让用户在无感知的情况下,就能享受到技术的价值。
长林、星衍、初雪三位技术人业务方向各不相同,但聊天过程中,他们不约而同地提到了同样的关键词:
“踏实” “敢为”。
这是他们仨对京东技术风格的形容词。
在他们看来,京东的技术风格没有太多“花活”,但正因为扎实,才适合做长期的事。
这种风格背后,其实也离不开对人才的持续投入。三位同学都提到,自己在入职初期能快速上手,很大程度得益于导师和前辈的“带一把”。
不仅有专门的技术导师带着解决具体问题,也有不少学长学姐、业务负责人愿意一起拆需求、跑现场、推项目。就像长林说的那样,“你不是被扔进来自己摸索,而是真的有人和你并肩一起走。”
京东对技术人的重视,从来不只是拿来用好,更是长期养好。
而在技术人才培养这件事上,京东今年又往前迈了一大步。
今年5月,京东正式推出了TGT计划(Tech Genius Team,顶尖青年技术天才计划),面向全球招募毕业两年内的硕博技术人才,同时也向有算法竞赛或顶会论文等硬实力的优秀本科生开放。
只要你在AI、大模型、机器人、推荐系统等方向具备足够的科研潜力,TGT都为你打开了通道。
与传统校招不同,TGT在培养机制、激励制度上都做了不少“破框”。
比如,薪资不设上限,真正以能力和潜力定薪;又比如,配套设立了“三导师制”,技术导师指导科研突破,业务导师帮你打通落地路径,成长导师陪你梳理职业规划;还有专属的场景资源与算力支持,你做的每个算法实验、每次模型迭代,都有真实数据支撑、真实问题反馈。
在技术练兵这件事上,京东天然有巨大的场景优势。海量电商数据、物流网络、金融风控场景……这些构成了一个庞大、完整、真实的技术应用生态。
你可以在这里调系统、跑实验、出论文,也可以直接上线服务千万用户——从0到1的基础研究、从1到100的规模部署,整个链路你都能看见。
△京东技术沙龙
TGT计划只是一个起点。
对技术人来说,真正重要的,是站到真实问题中去。
就像星衍对我们说的:“在京东,不是等你研究好了再找应用场景,而是边研究、边落地,心向星辰大海,也踏实走好脚下的每一步。”
此次我们接触的三位同学分属不同业务线,参加工作后每天经历的挑战也各不相同,但他们都在话语间透露出这样一个信息:
都想找一个值得一做再做的事情。
说起来,京东这三位同学都是屏幕前你我的同龄人,要说有什么不同,就是他们一路上坚定地选了那个自己更想尝试的方向。
这样的工作状态也没什么主角光环加持。但找到这么一个地方,确实需要一点运气。
幸运的是,他们刚好找到了一个能做事,也能被看见的地方。