阿里千问变局:天才与巨头的分叉口
创始人
2026-03-11 16:51:52
0

文|光锥智能 魏琳华

3月4日凌晨,林俊旸在 X 上发布“me stepping down. bye my beloved qwen”,那时他是否会想到如此之大的舆论震动,我们不得而知。

但在前一天宣传模型,后一天就宣告离开的情况下,千问大模型(下称Qwen)裂开了一条缝隙,外部得以嗅到来自阿里内部变化的气息。

一天后,阿里集团CEO吴泳铭签发了林俊旸的离职令,并以前所未有的姿态组建了一个由集团最高权力核心构成的“三人小组”,这个三人小组包括吴泳铭、阿里云CTO周靖人和现任饿了么董事长兼CEO的范禹,共同接管Qwen资源调度的问题。

放在今天,Qwen在中国开源生态的贡献上有目共睹,但带头做出Qwen2.5、Qwen3系列模型的两个技术负责人周畅和林俊旸,先后离开了阿里。

在这场离职风暴的中心,隐藏着一个关于“实验室理想”与“AI帝国”如何注定分离的命题:

阿里需要的,是一个能够证明阿里AI实力的先进模型,为阿里拿下 AI 时代的新入口;一个能在MaaS战场上,为阿里云收割付费Token消耗的稳定引擎。而林俊旸追求的,是极致的开源精神和垂直整合的组织架构。

两者的故事中,谁都没错,但林俊旸和阿里,已经逐渐来到了分道扬镳的岔路口。

告别Qwen周畅和林俊旸先后出走的背后

要理解这场离职风暴的深层逻辑,需要将时间拨回更久以前。

在林俊旸之前,阿里巴巴在大模型领域已经经历了一次核心人才的变化。

第一次,以周畅为首的AI团队跳槽,是阿里Qwen团队技术骨干出走的一个关键节点。

曾作为阿里P9级别员工的周畅,选择加入了字节跳动。据悉,加入字节后,周畅不仅获得字节4-2职级,相当于连跳两级,且薪资高达千万级别,比之前翻了好几倍。

周畅的离职,不仅是因为薪资,一部分原因也在于对个人对技术路线的偏好。据晚点LatePost报道,彼时的周畅看好多模态方向,但放在2024年,也就是大厂集中押注大语言模型的情况下,周畅看中了字节视觉团队抛来的橄榄枝。

人才的流失,显然引起了阿里的警觉。作为接过周畅重任、担任阿里Qwen模型团队的技术负责人,从校招P6级别进入阿里,到几年内多次升职,林俊旸成为了阿里最年轻的P10级别员工。

用马云的话说,离职无非两种原因,一是钱没有给到位,二是“心委屈了”。林俊旸的走,显然属于后一种。

3月4日凌晨,林俊旸在X上宣布离职,到第二天阿里批准离职。两天时间内,通过阿里员工发言和媒体报道,基本已经还原出林俊旸的离开,其中难免有和阿里组织的摩擦问题。

最影响到Qwen本身发展的,可能是对团队内部资源不足的摩擦。

一个小切口是,林俊旸需要牵头为Qwen码来更多资源,难免对Qwen团队内部是否为AI Infra额外投入、投入多少的想法不同。

林俊旸本人对Infra非常看重,这一点,他也在公开场合强调过。

“今天还有一个激动人心的事情,算法和Infra联合优化的事情是真真实实存在的。”林俊旸在AGI-Next峰会上说,“除了像DeepSeek提到的提升训练效率、节省资源成本外,我们要完成难度高的任务,都需要Infra的相关支持。”林俊旸说。

虽然阿里有额外的机器学习平台PAI负责提供这部分的支撑,但在林俊旸看来,还需要进一步加码,比如在团队中招聘更多相应人才。在林俊旸的社媒平台中,也公开放出过招聘Infra相关人才的信息。

林俊旸在社交媒体上招RL Infra岗位人员

对Infra的看重,不只是林俊旸对阿里的判断。落在今年对AI失意的腾讯身上,Infra也成了“天才少年”、OpenAI前研究员姚顺雨加盟后的重点之一。

在光锥智能此前的文章《腾讯重构AI的1000天》中,也曾提及,在腾讯年会上,内部表示,此前模型训练的一些问题原因可能在于基础设施Infra的不足。在姚顺雨进入腾讯后,公司单独成立了AI Infra部门和AI Data部门,区别于之前的部门架构,TEG中和AI训推相关的工作不再和其他业务合并,而是独立为AI服务。

但在后期,林俊旸希望自建Infra的实现并不顺遂。在晚点播客中,提及林俊旸为了达成相关目标,发生了越过周靖人向阿里集团CEO兼阿里云CEO吴泳铭寻求HeadCount(正职名额)的情况。所幸最终,林俊旸如愿以偿。

至于在其它资源上的不足,在3月4日阿里内部召开的会议中,阿里也承认了这一点。据智能涌现报道,关于招聘问题、内部算力有限问题,周靖人表示,团队处于“资源紧张状态”,内外差异有很多历史原因,未来会进一步规划。

发力顶尖模型阿里对内动刀

在“为什么做”的问题上,阿里与林俊旸之间同样存在深刻的裂痕。

作为纯技术人才,林俊旸在Qwen开源模型名气的打响上,起到浓墨重彩的一笔。也是在AGI-Next峰会上,林俊旸曾经分享过团队为什么会考虑做小尺寸模型,起始是因为团队中有人曾建议开源用于预训练试验的1.8B小尺寸模型,会对一些开发者起到帮助。

林俊旸

林俊旸对开源政策的激进,也在公开发言中有所体现。他曾表示,自己希望推进Qwen3-Max大模型的开源,但未能如愿。

“全尺寸、多模态、重开源”的策略,帮助阿里在开源社区中建立了无可匹敌的生态优势。以最新发布的Qwen3.5为例,除了最先开源的版本,阿里还后续发布了Qwen3.5系列的0.8B、2B、4B和9B四款小尺寸模型,在X上获得了马斯克的点赞。

但在阿里的视角中,从追求AGI的愿景上,阿里需要的是一个能够领先于“六小虎”和字节、腾讯的多模态大模型;于阿里云需要靠MaaS扩张业务的情况下,集团希望有一个能打的大模型,像Kimi K2.5、字节豆包模型那样,在API上收入进一步扩大。

在Qwen核心人员百余人、资源有限的情况下,Qwen系列的旗舰模型在国内大模型混战中,无法做到在所有系列中都拿到最好成绩。

以最新发布的Qwen 3.5旗舰模型为例,作为一个参数397B的原生多模态大模型,讲究“力大砖飞”的情况下,让它和月之暗面万亿参数级别的Kimi-K2.5放在一起比分数,似乎有些尴尬。在Coding当前更看重模型质量阶段,Qwen3.5虽然做到了性价比优势,但它不是当前“掰腕子”的核心。换言之,Qwen3.5的发力和阿里内部的期许,走偏了。

回顾之前Qwen2.5、Qwen3系列大模型,阿里当前在模型生态上的成绩有目共睹,甚至被称为“源神”。但在大模型发展如此迅速的情况下,阿里也依然很着急。

出于对AI的焦虑,挖人、组织架构的调整,就变成了顺理成章的思路,这一点在大厂上,基本是必选项。

在谷歌担任L7级别、参与Gemini研发的周浩,是阿里从硅谷挖回来的人才。据悉,周浩将接手的是Qwen团队的后训练负责人一职,这也对应了前后训练负责人郁博文的离开。

人才是第一步,接下来,阿里将到对准内部,开始对组织架构动刀。据悉,这也是引爆林俊旸和阿里冲突的导火索之一。

多家媒体报道,通义实验室近期计划将Qwen团队分拆,从涵盖不同训练流程和模态的“垂直整合”体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队。更进一步的是通义实验室内部之间的合并,比如将Qwen负责图像模态的部分并入负责图像生成的通义万相。语音模型部分并入通义百灵。

但在林俊旸之前所在的架构来说,他更坚信“垂直整合”的思路——将模型训练的全流程,从数据处理、架构设计、预训练、后训练到推理部署,都控制在同一个团队内部,形成高度协同的闭环。

而在这种整合完成、Qwen模型团队分割成多个水平团队后,留给林俊旸的位置和空间变得有限。在刘大一恒继续担任预训练负责人、周浩担任后训练负责人的情况下,林俊旸原定的位置成迷,且职责范围相比于之前“一手抓训练、模型”的情况,压缩到分管某个领域的位置。

可以预见的是,在完成组织架构调整后,阿里还需要一位类似姚顺雨、吴永辉之类的技术大牛,来把控这个进一步扩大、拆分的组织架构。

至此,林俊旸和阿里,走到了不得不分手的岔路口。

在 AI 时代,核心顶级人才从来不缺机会,也拥有比普通人更理想的追求;但在时代的巨变前,科技巨头需要把握根据趋势不断调整方向盘,以确保整体的利益最大化。这里没有绝对的对与错。

我们祝愿林俊旸能够在“狂飙”的AI大模型行业中,找到自己的位置;也祝阿里在下定决心修整组织架构后,能够做出心目中的Qwen-4,在旗舰模型中找到自己理想的生态位。

相关内容

热门资讯

行业首例 广州银行等5家银行涉... 来源:21世纪经济报道 强监管之下,上市公司财务造假案的追责链条正在不断延伸,这一次被盯上的是5家涉...
这场陆家嘴论坛,把中国经济金融... 来源:市场资讯 (来源:券研社) 从2008年启航,陆家嘴论坛就是观察中国经济金融走势的重要风向标...
银行间主要利率债收益率走势分化 每经AI快讯,6月23日,银行间主要利率债收益率走势分化,10年期国开债“26国开05”收益率上行0...
赋能实体商户 激活经营动能——... 为精准破解本地实体商户资金承压、增收遇阻等经营痛点,拓宽商户多元盈利渠道。6月16日下午,萍乡市创业...
“物理AI第一股”Moment... 6月23日,全球领先的物理AI公司Momenta在港交所刊发聆讯后资料集(PHIP),这意味着公司已...
中老年奶粉市场持续升温 精准营... 本报讯(记者 唐瑞)随着人口老龄化进程加速和银发经济政策红利持续释放,中老年乳品市场正迎来增长。据马...
马斯克之后,谁将成下一个万亿富... 来源:财联社 得益于对SpaceX的持股,埃隆·马斯克在该公司6月12日上市后,成为全人类历史上首位...
原创 中... 作品声明:本文仅在今日头条发布,谢绝转载 中国稀土供应再度削减35%,日本首相高市早苗押宝印度,真...
原创 埃... 要让这一理论概念成真并开启银河系,需要具备哪些条件。 随着商业航天产业的兴起,快速的技术进步让以往...
智慧医疗展厅的技术新趋势——动... AI医疗企业展厅的内容呈现,长期被一个难题困扰:技术迭代太快,AI医疗展厅更新太慢。 传统的解决方式...
这类粽子谨慎吃!厦门眼科中心吴... 粽叶飘香,软糯香甜的粽子成为节日标配,不少人一餐能吃下两三个。大众大多知道粽子难消化,却很少知道过量...
1400只基金宣布限购,科技基... 最近看到一个数字:国内已经超过1400只基金宣布限购,部分科技主题基金今年以来涨幅超过150%。 这...
前次融资刚“流产”,德龙激光定... 深圳商报·读创客户端记者 张弛 6月22日,苏州德龙激光股份有限公司(688170.SH)披露《20...
原创 全... 全球金融格局正在迎来一场悄无声息的颠覆性重构。最新美国财政部数据披露,中国美债持仓持续走低,刷新20...
奥来德涨1.18%,成交额10... 来源:新浪证券-红岸工作室 6月22日,奥来德涨1.18%,成交额10.05亿元,换手率7.14%,...
“给大气做CT”的青岛企业,拟... 青岛赴港上市企业队伍再扩容。 6月17日,“海鸥计划”——青岛赴港上市企业引育行动正式启动,镭测创芯...
利用外资固稳促优 多部门详解政... 商务部会同国家发展改革委和财政部近日联合印发的《利用外资固稳促优行动方案》22日对外发布。国务院新闻...
深耕私行特色服务 青岛银行以“... 近日,由普益标准主办的2026资产管理与财富管理行业发展大会暨第六届“金誉奖”颁奖典礼在成都落幕。凭...
原创 法... 国际能源市场这块大棋盘,向来是大国博弈的主战场。 过去几十年,谁掌握原油的定价权,谁就握住了全球经...