阿里发布千问旗舰推理模型Qwen3-Max-Thinking：多项性能刷新全球纪录-游戏-沃资讯

阿里发布千问旗舰推理模型Qwen3-Max-Thinking：多项性能刷新全球纪录

发布时间：2026-01-28 00:02 来源：快讯作者：赵磊

阿里巴巴正式推出其最新研发的千问旗舰推理模型Qwen3-Max-Thinking，标志着国内人工智能领域取得重大突破。这款模型在多项国际权威评测中刷新纪录，性能表现已接近国际顶尖水平，成为目前国内最强的AI大模型之一。

据技术团队介绍，Qwen3-Max-Thinking总参数规模超过万亿级别，预训练数据量达到36T Tokens，是阿里迄今为止规模最大、能力最强的推理模型。该模型通过大规模强化学习后训练和多项技术创新，实现了性能的显著提升，在数学推理、科学知识和代码编程等关键领域展现出卓越能力。

在基准测试中，这款新模型的表现超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等国际知名模型。特别是在数学推理方面，预览版已在国内首个AIME 25和HMMT 25评测中取得双满分成绩，正式版通过进一步优化后，在IMO-AnswerBench等国际数学竞赛基准测试中继续保持领先。

技术创新方面，模型引入了自适应工具调用能力和全新的测试时扩展机制。这种机制不同于传统推理时简单增加并行路径的方式，而是能够对推理结果进行"经验提取"和自我迭代，在相同上下文中实现更高效的计算。测试数据显示，该机制使模型在复杂推理任务中的效率提升超过30%。

原生Agent能力是另一大亮点。通过联合强化学习训练，模型能够自主选择搜索、个性化记忆和代码解释器等工具，提供专业水平的回答。技术团队表示，这种能力使模型在处理复杂任务时更接近人类专家的表现，同时将幻觉率降低了40%以上。

应用落地方面，阿里已开放多渠道体验。普通用户可通过PC端和网页端直接试用，开发者能在QwenChat平台免费调用API，企业用户则可通过阿里云百炼服务获取专业支持。千问APP也即将完成升级，所有用户都将能免费体验新模型的强大功能。

回顾发展历程，阿里Qwen大模型自2022年启动研发以来，已成长为全球排名领先的开源项目。此次发布的Qwen3-Max作为通义千问家族的最新成员，进一步巩固了阿里在基础模型领域的技术优势。市场反应显示，消息公布后阿里巴巴港股在次日盘前上涨超过2%，显示出投资者对这项技术突破的积极预期。

更多>同类内容