专栏名称: 新周刊
中国最新锐的生活方式周刊
目录
相关文章推荐
三联生活周刊  ·  当下,在哪里能找到生活的“新答案”? ·  昨天  
三联生活周刊  ·  年轻人不要随便读哲学 ·  2 天前  
三联生活周刊  ·  你有没有发觉,现在的女装变得又丑又贵了? ·  2 天前  
51好读  ›  专栏  ›  新周刊

高考题,AI大模型不能解,也不敢解

新周刊  · 公众号  · 杂志  · 2025-06-11 16:21

正文

请到「今天看啥」查看全文



而当随机测试了下市面上主流通用大模型解答高考题时,结果却出人意料——这些大模型压根没有想要参加高考。


上传了高考全国卷I数学试题后,有的大模型显示无法上传,有的则表示无法识别。而一同被“禁言”的解读的,还有往年的高考数学题。

各大主流国产模型厂商对今年高考数学题的回应

高考期间(6月7日-10日),主 流国产模型 厂商对今年高考数学题的回应。(图/网页截图)


事实上,不只是数学难题,国产大模型已经屏蔽掉了K12阶段学科(语文、数学、英语、物理、化学、生物、历史、地理、政治)内容的部分推理与解析能力。具体而言是,图片识题(拍题)功能禁用,高考真题关键词屏蔽,甚至禁止回答具体某年高考题目。

DeepSeek对高考以及高考题相关的话题限制非常严格,而给出略显详细的提示词后,会给出丰富的答案。

高考期间(6月7日-10日),相比其他大模型应用,DeepSeek对高考以及高考题相关的话题限制更为严格,而给出略显详细的提示词后,也会给出丰富的答案。(图/网页截图)


也就是说,在今年高考期间,主流的国产模型厂商,都主动或被动对高考采取了限制措施,这在国产大模型发展进程里还是头一回。


实际上,ChatGPT、Claude等国外的大模型可以解答今年高考相关题目,并且以高水平完成推理过程。而大多数国产通用大模型,已经在多项技术指标上持续逼近全球顶级水平,甚至在某些垂直细分场景呈现领先的趋势,也意味着它们是具备足够的能力来解答这些题目的。


很显然,这一次功能“降级”,本质上是一次策略性的行为,也是平台技术治理与内容安全机制的体现。


当前,多数模型处理高考题的模式是,当识别到题干结构类似高考题(选择题、大题、简答题),会直接返回“不支持”或“无法识别”。而图片上传识别时,系统会直接禁掉OCR模块或限制调用次数。与此同时,也对“高考”,“高考真题”等关键词自动限流。这是大模型的内容风险识别系统在发挥作用。







请到「今天看啥」查看全文