前阿里千问大模型负责人林俊旸在离职后,其创业计划引发了广泛关注。据悉,他即将创立的新公司虽尚未公布名称,但种子轮目标估值已高达20亿美元,折合人民币约135亿元。这一数字对于一家尚未发布产品的中国AI初创企业而言,几乎无前例可循,但与林俊旸在硅谷的同行相比,这一估值并不算高。
林俊旸于2019年加入阿里巴巴,早期专注于搜索、推荐场景下的自然语言处理和多模态建模研究。2020年,他开始投身于大规模预训练模型的研究与部署,深度参与了M6等超大规模预训练模型项目。M6作为阿里早期最具代表性的多模态大模型项目之一,为林俊旸积累了丰富的经验。2022年后,他转向通用大模型方向,并成为Qwen项目的技术负责人,带领团队打造了Qwen系列大语言与多模态模型,并主导了开源工作。Qwen项目不仅成为阿里AI对外展示的重要技术名片,还以其多样化的模型尺寸、开源路线以及持续更新的多模态、代码和轻量化模型版本,赢得了开发者的广泛认可。
林俊旸的创业之所以备受瞩目,不仅因为他在Qwen项目中的卓越贡献,更因为他对未来AI发展方向的独到见解。离职后,他发表了一篇题为《From “Reasoning” Thinking to “Agentic” Thinking》的长文,对过去一年的模型竞争进行了复盘,并暗示了下一阶段创业方向的技术路线。
在这篇长文中,林俊旸提出,上一阶段的AI竞争聚焦于让模型更会思考,而下一阶段的竞争则将转向让模型为了行动而思考。他强调,真正的挑战在于代码库导航、计划拆解、错误恢复、工具编排以及长时间执行任务的质量。为此,他引入了“Agentic Thinking”这一核心概念,即一种“为了行动而思考”的能力。这种能力不仅要求模型在回答前进行更长时间的推理,更要求模型能够在环境中行动、观察反馈、修正计划,并继续推进。
林俊旸认为,随着反馈信号的可靠性和基础设施支撑能力的提升,语言模型之上的强化学习(RL)已经能够产出质的飞跃式的认知能力。然而,更深层次的转变是从推理式思考到智能体式思考,即从想得更久到为了行动而想。这一转变意味着训练的核心对象已经变成了模型与环境的系统,或者更具体地说,是智能体和围绕它的编排框架。因此,环境设计、轨迹采样基础设施、评估器鲁棒性以及多智能体之间的协调接口等要素变得同样关键。
自发表长文后,林俊旸在个人社交媒体上鲜有发声,仅转发了一条关于持续学习基准测试的消息,引发外界对其创业方向的进一步猜测。据The Information报道,已有两家知名投资机构就投资事宜与林俊旸的实验室进行了深入洽谈,这无疑为他的创业计划增添了更多期待。



















