在AI编程能力的全球竞技场上,中国科技企业再次展现强劲实力。国际权威盲测平台LMArena旗下Code Arena榜单最新一期结果显示,阿里巴巴自主研发的Qwen 3.6-Plus大语言模型以1452分的成绩跃居全球第二,成为该榜单中排名最高的中国大模型。这一突破性成果标志着国产AI模型在工程化开发领域已具备与国际顶尖技术正面竞争的实力。
作为AI领域最具公信力的评测体系之一,LMArena通过真实用户盲测和实时对抗机制构建评价体系。其React专项榜单聚焦AI模型在复杂Web开发场景中的自主编码能力,要求模型独立完成从项目初始化到调试运行的全流程开发。这种评测方式突破传统代码补全测试的局限,更强调工程思维与端到端开发能力的综合考察,被视为当前AI Coding领域最具挑战性的技术方向。
Qwen 3.6-Plus于4月2日正式发布,凭借原生多模态理解与推理能力,在代码生成和Agent技术方面表现尤为突出。该模型在多项权威编程评测中持续领先,以更少的参数量实现超越GLM-5、Kimi-K2.5等参数量翻倍甚至三倍模型的性能表现。此次在React榜单中,Qwen 3.6-Plus以4分优势领先OpenAI最新发布的GPT-5.0-High,与Anthropic旗下Claude-Opus-4.6-Thinking的差距缩小至88分,展现出国产模型在工程化开发领域的显著进步。
在Code Arena综合榜单中,Qwen 3.6-Plus同样稳居国产模型首位。这一成绩推动阿里巴巴在全球AI实验室排名中升至第四位,紧随Anthropic、OpenAI和Google之后。值得注意的是,该模型发布首日即在开发者社区引发强烈反响,次日便以黑马姿态冲入React榜单前三,其快速迭代能力与技术落地效率获得行业高度认可。
据技术团队透露,Qwen 3.6-Plus作为千问3.6系列的首发模型,后续将开源多个不同参数规模的版本。性能更强的旗舰模型Qwen3.6-Max已进入最终测试阶段,预计将于近期正式发布。这一系列布局显示阿里巴巴正通过开源生态建设与前沿技术研发双轮驱动,持续巩固其在AI工程化领域的领先地位。




















