在2025年高考期间,为确保考试的公平公正,国内多家知名AI大模型,包括腾讯混元、通义千问、Kimi和豆包等,主动暂停了图片识别问答功能。这一举措旨在防止高考生利用AI技术作弊。然而,这一做法也引发了一些讨论,有人认为这些企业对自家AI大模型的能力或许有些高估,因为之前的相关测试中,AI大模型在解答高考题目上的表现并不尽如人意。
尽管如此,随着2025年高考全国一卷的部分科目试卷公布,包括语文、英语和数学,媒体和公众再次将目光投向了AI大模型的能力。特别是对于数学科目,有人提出疑问:这些AI大模型能否像真正的学生一样,解答出高考的数学题目?
为了验证这一点,有人选择了六款AI大模型——DeepSeek、豆包、讯飞星火、文心一言、Kimi和通义千问,进行了一场别开生面的“高考”。测试环境允许AI大模型联网并使用深度思考功能,所选的数学题目涵盖了单选、多选、填空和简答等多种题型。
在第一题中,双曲线的离心率问题对于六款AI大模型来说似乎只是小菜一碟,它们全部得出了正确答案,并且给出了详细的推理过程。这一轮测试中,所有AI大模型都获得了满分。
然而,随着题目难度的增加,AI大模型之间的表现差异开始显现。在第二题中,关于三角形和正弦函数的问题让一些AI大模型陷入了沉思。豆包迅速得出了正确答案,而讯飞星火和通义千问虽然也最终得出了正确答案,但耗时较长。DeepSeek更是耗时接近10分钟才完成这道题目。
在第三题中,等比数列的问题对于大多数AI大模型来说并不构成太大挑战,除了豆包在输出答案时犯了迷糊,排除了一个正确答案外,其他AI大模型都迅速得出了正确答案。然而,在第四题中,一个关于数列和函数的复杂问题再次考验了AI大模型的实力。豆包、讯飞星火、Kimi、文心一言和DeepSeek依然表现出色,而通义千问则在这一轮测试中败下阵来。
经过四轮激烈的角逐,最终DeepSeek、讯飞星火、Kimi和文心一言以满分脱颖而出,豆包虽然因一时疏忽丢了三分,但依然展现出了强大的实力。而通义千问虽然在处理简单问题时表现出色,但在面对复杂问题时则显得有些力不从心。
这场“高考”不仅检验了AI大模型的实力,也让我们看到了它们在教育和辅导方面的巨大潜力。未来,随着AI技术的不断进步,学习机厂商和教育辅导平台或许可以与这些头部AI企业合作,共同推动AI教育硬件业务的发展,为学生提供更加高效、智能的学习辅助工具。