ClawBench大模型榜单揭晓:智谱字节小米四款模型闪耀全球前十

   发布时间:2026-04-01 00:11 作者:胡颖

评测机构ClawBench最新发布的大型模型榜单引发行业关注,北京三家人工智能企业的四款模型成功跻身全球前十。其中,智谱科技的GLM-5-Turbo以93.9分的成绩登顶榜首,字节跳动旗下的豆包模型Doubao-Seed-2.0-lite紧随其后位列第二,并凭借最低使用成本成为全榜单中最具性价比的选择。小米公司则凭借MiMo-V2系列两款模型实现突破,MiMo-V2-Omni和MiMo-V2-Pro分别占据第九和第五名。

小米官方披露的技术细节显示,MiMo-V2-Pro在复杂逻辑推理、长指令执行和多轮对话稳定性等核心指标上表现突出。该模型在Model Rank全球排名中位列第五,同时在实验室综合研发能力评估体系LabRank中取得双料佳绩:在Text Arena(ArenaExpert)榜单中排名全球第四,Code Arena榜单中排名全球第五,综合研发实力仅次于Anthropic、OpenAI和谷歌三家国际顶尖机构。

ClawBench榜单的评测机制具有显著创新性,其关联的Text Arena榜单采用双盲测试模式,通过隐藏模型身份的方式,由全球真实用户根据回答质量直接投票评选。这种设计有效规避了传统评测中针对特定数据集优化导致的"刷榜"现象,使得评测结果更能反映模型在实际应用场景中的表现。字节跳动的豆包模型正是凭借这种评测机制下的成本优势,在保持高性能的同时实现了更低的使用门槛。

 
 
更多>同类内容
全站最新
热门内容