阿里Qwen3模型升级发布,性能超越Kimi-K2等,多语言及长文本能力显著增强

   发布时间:2025-07-22 19:55 作者:郑浩

阿里巴巴旗下的通义千问近日宣布,其旗舰版Qwen3模型迎来了一次重要更新,推出了名为Qwen3-235B-A22B-Instruct-2507-FP8的新版本,该版本特别引入了“非思考模式”的增强功能。

据官方介绍,此次更新的Qwen3模型在多项通用能力上实现了显著提升,尤其是在指令遵循、逻辑推理、文本理解、数学运算、科学知识、编程技能及工具使用等方面。在多个权威测评中,如GQPA(知识评估)、AIME25(数学竞赛模拟)、LiveCodeBench(编程能力测试)、Arena-Hard(人类偏好对齐测试)以及BFCL(智能体能力评估)等,Qwen3均展现出了卓越的性能,超越了Kimi-K2、DeepSeek-V3等顶级开源模型,以及Claude-Opus4-Non-thinking等领先的闭源模型。

除了通用能力的提升,Qwen3新模型还在几个关键性能方面实现了增强。首先,在多语言环境下,模型对于长尾知识的覆盖能力有了显著提升,能够更好地理解和处理多种语言中的复杂信息。其次,在主观及开放性任务中,模型对用户偏好的契合能力得到了加强,能够生成更加贴合用户需求、质量更高的回复和文本。新模型的长文本处理能力也大幅提升至256K,进一步增强了其上下文理解能力。

此次更新的Qwen3模型已经在魔搭社区和HuggingFace平台上开源发布,供开发者和研究人员免费使用。这一举措无疑将推动人工智能领域的技术创新和应用发展,为更多行业带来智能化的解决方案。

Qwen3新模型的推出,标志着阿里巴巴在人工智能领域的研究和应用又迈上了一个新的台阶。随着技术的不断进步和应用场景的不断拓展,我们有理由相信,未来Qwen3将在更多领域发挥重要作用,为人们的生活和工作带来更多便利和价值。

 
 
更多>同类内容
全站最新
热门内容
本栏最新