近日,人工智能领域迎来一则重磅消息:Transformer架构的奠基人之一、Gemini技术联合负责人诺姆·沙泽尔(Noam Shazeer)正式宣布加入OpenAI,担任新的“架构研究负责人”,将致力于推动下一代超级智能的研发。
诺姆·沙泽尔在AI领域的地位举足轻重。2017年,他与团队发表了具有划时代意义的论文《Attention Is All You Need》,首次提出了Transformer架构。这一架构如今已成为所有主流大模型的基础,包括GPT、Gemini和Claude等。沙泽尔不仅是论文的作者之一,还亲自设计了多头注意力机制和残差结构,并完成了首个超越当时最优水平的实现。
除了Transformer,沙泽尔的贡献还涉及多个关键技术领域。2016年,他提出了稀疏门控混合专家(MoE)模型,为现代大模型节省算力提供了核心解决方案;2018年,他开发了Mesh-TensorFlow,使超大规模Transformer的训练成为可能;他还是谷歌对话系统LaMDA和T5模型的重要贡献者。可以说,现代大模型的底层技术几乎都与他息息相关。
沙泽尔的职业生涯充满传奇色彩。1994年,他在国际数学奥林匹克竞赛中斩获金牌,随后进入杜克大学攻读数学与计算机专业。2000年,他加入初创的谷歌,负责改进搜索引擎的拼写纠错功能,并开发了PHIL算法,成为谷歌AdSense系统的核心。2021年,他离开谷歌,与丹尼尔·德弗雷塔斯(Daniel De Freitas)共同创立了Character.AI。
2024年8月,谷歌为重新吸引沙泽尔回归,以27亿美元的价格授权了Character.AI的技术。这笔交易不仅让沙泽尔个人套现约7.5亿至10亿美元,也使他成为谷歌Gemini项目的技术掌舵人之一。据传,他回归后发现了Gemini训练中的一个隐藏漏洞,大幅提升了模型训练效率,助力Gemini 3登顶各大榜单,甚至迫使OpenAI内部拉响“红色警报”。
沙泽尔的加入对OpenAI而言意义重大。OpenAI首席研究官马克·陈(Mark Chen)在宣布这一消息时表示,沙泽尔在Transformer、MoE和高效解码方面的工作“塑造了现代AI”,并称赞他对实现通用人工智能(AGI)的坚定信念和清晰思路。值得注意的是,沙泽尔的新职位是“架构研究负责人”,这意味着他将专注于探索“Transformer之后的技术”,而非优化现有产品。
更引人关注的是,OpenAI已集齐两位Transformer原始作者。除沙泽尔外,卢卡什·凯泽(Lukasz Kaiser)早在五年前便加入OpenAI,主导了推理模型o1和o3的核心研发。如今,两位奠基人将在同一团队中合作,共同搭建下一代AI的架构。这种组合在行业内堪称独一无二。
沙泽尔对超级智能的追求近乎狂热。他曾公开讨论“百万个自动化研究员”在数据中心中工作的场景,并预言世界GDP可能因此增长100倍。当被问及大模型为何有效时,他甚至以“神的恩典”来形容其背后的未知机制。这种对未知的敬畏与探索精神,或许正是他不断推动技术边界的动力。
随着沙泽尔的加入,OpenAI在通往超级智能(ASI)的道路上迈出了关键一步。而谷歌虽以重金挽留,却未能阻止这位核心人物的离开。这场人才争夺战的结果,或许将深刻影响未来AI技术的格局。





















