林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理
3月27日,前阿里千问技术负责人林俊旸离职后发表长文,明确指出 AI 大模型的发展路线正在经历重大跨越,核心竞争焦点正从“推理型思考(Reasoning Thinking)”全面转向“智能体思考(Agentic Thinking)”。
文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一***理模型浪潮,指出这标志着行业从扩大预训练规模,正式步入扩大强化学习(RL)后训练规模的新阶段,数学与代码等可验证领域成为优化模型正确性的核心试金石。
林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他透露,千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量 Token 进行复杂推演,两者在数据分布和行为目标上存在根本冲突。若数据筛选不当,强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求,Qwen 在后续的 2507 版本中选择推出了分离的 30B 和 235B 指令与思考变体。与之形成对比的是,Anthropic 和 DeepSeek 等厂商则继续在统合推理与工具调用的混合架构上进行探索。
针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代***的智能体思考。他指出,智能体强化学习(Agentic RL)彻底改变了原有的技术栈要求,训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限,防范奖励***(Reward Hacking)将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身,而是转移至高质量环境设计、防***协议以及多智能体协同编排等系统工程能力上。
来源:凤凰网科技返回搜狐,查看更多
同类文章排行
- 我应该设置多少kb才能让他不能玩游戏?
- 你都见过什么样的电脑盲?
- 为什么10年前电脑内存就普遍16GB了,现在还是普遍16GB?
- postgres集群的选择?
- 为什么Mac连个正儿八经的CAD都装不了还敢打着生产力的旗号?
- 为什么某些人说中国现在全球军事实力第一,但包括中国人在内很多人不认可?
- 你们是怎么远程用NAS听歌的?
- WordPress太慢了有什么办法解决吗?
- 你卡过最厉害的bug是什么?
- 如何评价B站up主***千代退网?
最新资讯文章
- 为什么“柴犬”从万人迷,变成万人嫌?
- 为什么欧美影视喜欢露点?
- 为什么那么多人用GO?GO语言的优势在哪里?
- 如何娶到俄罗斯女人?俄罗斯女人是不是都想嫁中国男人?
- 男人比女人多三千万,多在哪里?
- 大一计算机新生怎么合理利用github?
- 本人女20,平胸跟男生一样怎么办 ?
- 银行股为什么大涨几年?
- 各位前端大触们,一般怎么定颜色的?
- 俄罗斯现在经济怎么样?
- 如何评价绿联DH4300 Plus,是否值得购买?
- 你是否亲眼见过性格懦弱胆小怕事的人蜕变成刚强老练、天不怕地不怕的人?
- 为什么是9月3日阅兵而不是10月1日国庆阅兵?
- 高并发下怎么做余额扣减?
- 听说有一门技术叫windows批处理(bat),请问它有什么现实用途?






关注公众微信号
移动端,扫扫更精彩