阿里巴巴正式推出其最新研发的千问旗舰推理模型Qwen3-Max-Thinking,标志着国内人工智能领域取得重大突破。这款模型在多项国际权威评测中刷新纪录,性能表现已接近国际顶尖水平,成为目前国内最强的AI大模型之一。
据技术团队介绍,Qwen3-Max-Thinking总参数规模超过万亿级别,预训练数据量达到36T Tokens,是阿里迄今为止规模最大、能力最强的推理模型。该模型通过大规模强化学习后训练和多项技术创新,实现了性能的显著提升,在数学推理、科学知识和代码编程等关键领域展现出卓越能力。
在基准测试中,这款新模型的表现超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等国际知名模型。特别是在数学推理方面,预览版已在国内首个AIME 25和HMMT 25评测中取得双满分成绩,正式版通过进一步优化后,在IMO-AnswerBench等国际数学竞赛基准测试中继续保持领先。
技术创新方面,模型引入了自适应工具调用能力和全新的测试时扩展机制。这种机制不同于传统推理时简单增加并行路径的方式,而是能够对推理结果进行"经验提取"和自我迭代,在相同上下文中实现更高效的计算。测试数据显示,该机制使模型在复杂推理任务中的效率提升超过30%。
原生Agent能力是另一大亮点。通过联合强化学习训练,模型能够自主选择搜索、个性化记忆和代码解释器等工具,提供专业水平的回答。技术团队表示,这种能力使模型在处理复杂任务时更接近人类专家的表现,同时将幻觉率降低了40%以上。
应用落地方面,阿里已开放多渠道体验。普通用户可通过PC端和网页端直接试用,开发者能在QwenChat平台免费调用API,企业用户则可通过阿里云百炼服务获取专业支持。千问APP也即将完成升级,所有用户都将能免费体验新模型的强大功能。
回顾发展历程,阿里Qwen大模型自2022年启动研发以来,已成长为全球排名领先的开源项目。此次发布的Qwen3-Max作为通义千问家族的最新成员,进一步巩固了阿里在基础模型领域的技术优势。市场反应显示,消息公布后阿里巴巴港股在次日盘前上涨超过2%,显示出投资者对这项技术突破的积极预期。





















