通义巨震:周靖人收权,林俊旸放手?_Qwen_团队_阿里
文 | 象先志
文 | 象先志
林俊旸宣布离开千问,这个事非常突然,本来还在看几位长老陪马老师溜园的新闻。
目前确定的信息是,林俊旸是昨天下午提的离职,阿里那边刚开始走流程。同一天,Qwen的后训练负责人郁博文也正式离职,他的工作由年初从谷歌挖过来的zhou姓高管接任。
林俊旸去年刚晋升,是阿里最年轻的P10,外界担心他突然离开给Qwen后续模型研发和更新带来不确定性。
这种担心不太必要。
林俊旸和郁博文等固然是Qwen系列模型的核心功臣,大模型领域单兵能力的重要性也确实相比过去大幅提升,但阿里整个AI研发体系不可能只依赖于两三个重要的技术骨干。
我不相信Qwen因为林俊旸离开就会彻底陨落,就像我不太相信鹅厂招来姚顺雨就能扭转局面一样。
1
先梳理下林俊旸和郁博文等人离开的原因。
有传言是说,阿里内部对现有的开源模式有分歧,觉得开源的成本投入不划算,或者认为开源影响了阿里云卖自己的API。
这个说法不合理。我倒不是说阿里内部没有这种讨论,而是因为林俊旸是做模型基础研发,模型开源还是闭源,都不影响他工作结果的价值。就算阿里突然全面转向闭源,模型研发照样得有人带,后训练这些照样得继续做。
按照这个逻辑,唯一能把这两件事统一起来的,就是林俊旸确实有不可妥协的开源理想。给个P10又怎样,只要Qwen转向闭源,劳资立马撂挑子不干。
这种可能性有,但确实很小。不只是林俊旸走了,郁博文这些也走了,不可能说这些人都要当Richard Stallman吧。
而且综合各方面的消息,林俊旸的离开比较突然。
说是昨天下午通义开了场内部会议,会上产生分歧,林俊旸当场离开,几小时后就在X平台上宣布了离职的消息。林俊旸级别高,阿里如果真的想调整开源战略,这种业务负责人多少有点提前的吹风和讨论。
所以林俊旸突然离开,最大可能还是跟通义最近的组织调整有关。
而这个组织调整的原因,应该不是直接出于开源和闭源的战略有重大变化。今天阿里算是全球模型开源的扛把子,
HF上下载量一直保持领先。但阿里开源的整体状态是三角形:中腰部模型能力很强,但参数量最大的最强模型表现是有差距的。
阿里如果只是想做B端,通过云服务卖API,这个问题还没有那么关键,因为开源跟闭源是两个赛道。然而阿里从去年11月开始,已经明牌要参与这轮AI入口争夺。
因为千问APP起步晚了对手一年多,需要投入更多***追上对手,整个春节档阿里为千问投入的预算也是最多的。这些措施取得了明显效果,千问APP用户快速增长,目前已经甩开元宝,但仍然低于豆包。
从纯B端向B/C两端兼顾的转向,对Qwen的模型能力提出了更高的要求。集团层面,Qwen也得更多配合千问APP的产品团队,因为后者当下是集团最大的优先级。
林俊旸直接负责的Qwen团队隶属于通义实验室,后者由阿里云CTO周靖人负责。
通义正***将Qwen团队分拆,从涵盖不同训练流程和模态的 “垂直整合” 体系,转变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,这些团队仍隶属通义实验室。
晚点报道提到,林俊旸并不认可这种分开拆散团队的做法,他认为预训练、后训练,乃至 Infra 和训练团队应该更紧密地结合和沟通。
这个描述其实非常有意思,值得推敲一番。
预训练、后训练这些团队本身就是各自存在的,为什么在Qwen下面就是垂直整合,分拆过后就是水平分工呢?整个通义实验室依旧在周靖人博士的领导之下,各团队之间的拉通对齐怎么就不能做继续做呢?
按照互联网公司喜欢讲的管理学模型,甚至可以说这让组织结构进一步扁平化,有利于提高信息传递的效率。
当然这只是理论上,而理论跟实际往往有相当的距离。林俊旸和Qwen团队已经经过了长时期磨合,保持着高强度产出,做这种分拆一定意味着大量的组织摩擦和不确定性。
2
这些动作无法避免的后果是,林俊旸的“势力范围”在缩减。
他领导的Qwen团队从去年中开始组建自己的Infra团队,代替原来阿里云的人工智能平台PAI。也就是说,Qwen团队在逐步补齐所有LLM训练需要的基础设施。
OpenAI infra负责人翁家翌前段时间提到,真正拉开openai和meta差距的就在于infra上。他认为这其中的关键在于谁的RL infa BUG相对更少,训练迭代更快。
所以可以推测,林俊旸对于由阿里云PAI来负责通义各业务的infra不满意,因此要单独组建infra团队。
但阿里内部对Qwen团队的投入产生评价本身就是有分歧的,这种团队扩充或许进一步加剧了这种分歧,拉大了集团高管跟林俊旸团队的张力。据说甚至有高管对除夕夜亮相发布的 Qwen-3.5 并不完全满意,称其是一个 “半成品”。
最终的局面就变成,一边是林俊旸和Qwen团队感觉受到了集团的***掣肘,另一边则是集团对Qwen表现也不满意,要大调组织架构,提升产出并且加强跟C端产品的闭环。
今天还流出一份吴妈给通义团队开会的摘要,信息量很多但不保真。
看起来从谷歌挖过来的zhou姓高管,是林俊旸离职的导火索。zhou担心自己融不进Qwen团队,所以要求挂到周靖人下面。晚点报道也提到,zhou确实是直接向周靖人汇报。
这个细节如果属实,那基本意味着zhou跟林早就是要二选一。
因为zhou是搞后训练的,搞后训练的跟统筹模型研发的不对付,还向顶头上司“告御状”,暗示对方要排挤我,这后面抬头不见低头见的,哪里还有合作的可能。
既然最后zhou的诉求得到了满足,成功入职了,就说明周靖人和集团当时已经在两个人之间做出了选择。返回搜狐,查看更多
同类文章排行
- 大家对蔡澜这个人怎么看?
- 台湾是中国领土,那台湾海峡算是内海,为什么不击沉那些无理通过海峡的军事力量?
- 除了厚重,你拒绝折叠屏的理由还有哪些?什么样的折叠屏才能打动你?
- 美联储必须拉爆中国吗?
- 想自己做一本书,用什么排版软件?
- 你觉得《捞女游戏》会因为不可抗力而被下架吗?
- 家用服务器内网穿透对外提供服务需要备案吗?
- 消息称三大运营商将于今年下半年全面重启eSIM,eSIM有哪些好处?为何此前暂停这一业务?
- 一个练过功夫的姑娘能打过一个没练过的男人吗?
- 张伟丽可以打败什么级别的普通男性?
最新资讯文章
- 折叠屏手机有哪些有用或好玩的功能,你过去不理解,现在离不开?
- 什么笑话让你看一次笑一次?
- ***拍大尺度片子时摄影师不会看光吗?
- 鸿蒙PC操作系统是不是就是手机操作系统?
- 折叠屏手机有哪些有用或好玩的功能,你过去不理解,现在离不开?
- 茅台会在什么情况下崩盘?
- 程序员看剧的时候,如果看到有敲代码页面,会暂停看代码吗?
- 你们是怎样看待警察这一职业的?
- 从技术上看,cloudflare比其他公司牛在哪儿?
- 你的低成本爱好是什么?
- 小米 AI 眼镜发布,售价 1999 元起,有哪些功能亮点?你看好其市场前景吗?
- 你见过最漂亮的女生长什么样?
- 程序员平时都是CRUD开发工作,真的需要深入理解原理性的知识点吗?
- 为什么熊身上那么多可以吃的肉,偏偏就熊掌这道菜出名了?
- 柳州的债务,谁来还?用什么还?怎么还?






关注公众微信号
移动端,扫扫更精彩