专栏名称: AI科技评论
点评学术,服务 AI !
目录
相关文章推荐
中国政府网  ·  暴雨黄色预警! ·  昨天  
算法与数据结构  ·  “不是 Cursor 不够强,是 ... ·  2 天前  
罗文益  ·  算法推荐,就是今天普通人的风口 ·  2 天前  
罗文益  ·  算法推荐,就是今天普通人的风口 ·  2 天前  
51好读  ›  专栏  ›  AI科技评论

PK OpenAI o1,国产模型在高难度数学和算法竞赛的能力几何?

AI科技评论  · 公众号  ·  · 2024-12-09 18:34

正文

请到「今天看啥」查看全文


(一)实现类人模式,完成后会自我检查与纠错

同类的几个推理模型都有自我纠错环节,检查推理步骤并进行二次验证,当发现推理思路不对,会换个思路继续推理。

DeepSeek-R1

prompt:

设f(x)是定义域为R、最小正周期为5的函数.若函数g(x)=f(2^x)在区间[0,5)上的零点个数为25,则g(x)在区间[1,4)上的零点个数为

思维链路:

wait, 这样算好像不太对。

我应该重新考虑。对于每个 \( k \),\( a_i + 5k \in [1, 32) \),且 \( a_i \in [0, 5) \)。

所以,对于 \( k=0 \):\( 0+0=0 \) 到 \( 5+0=5 \),要 \( \geq 1 \),所以 \( a_i \in [1, 5) \) \( \Rightarrow \) 解为 \( x \) 满足 \( 2^x = a_i + 0 \Rightarrow x = \log_2(a_i) \)。

\( k=1 \):\( a_i + 5 \in [5, 10) \),要 \( \geq 1 \),即全部满足,因为 \( 5 \geq 1 \)。

所以 \( a_i \in [0, 5) \)。

\( k=2 \):\( a_i + 10 \in [10, 15) \),要 \( \geq 1 \),全部满足。

\( k=3 \):\( a_i + 15 \in [15, 20) \),要 \( \geq 1 \),全部满足。

\( k=4 \):\( a_i + 20 \in [20, 25) \),要 \( \geq 1 \),全部满足。

\( k=5 \):\( a_i + 25 \in [25, 30) \),要 \( \geq 1 \),全部满足。

\( k=6 \):\( a_i + 30 \in [30, 35) \),要 \( < 32 \),所以 \( a_i + 30 < 32 \Rightarrow a_i < 2 \)

K0-math

prompt:

在平面直角坐标系内,点M∈{(x,y)|x^2/200+y^2/8≤1},点A(2,1),若△OMA的面积不超过3,则满足条件的整点M的个数为

思维链路:

不过,我有点担心是不是有某些点不满足椭圆的条件。为了确保,我随机检查几个点:

比如,当 \( y = 2 \) 时,\( x = 10 \):

\[

\frac{10^2}{200} + \frac{2^2}{8} = \frac{100}{200} + \frac{4}{8} = 0.5 + 0.5 = 1

\]

符合条件。

再看看当 \( y = -2 \) 时,\( x = -10 \):

\[

\frac{(-10)^2}{200} + \frac{(-2)^2}{8} = \frac{100}{200} + \frac{4}{8} = 0.5 + 0.5 = 1

\]

也符合。

看来我的计算是正确的。

所以,满足条件的整数点 \( M \) 的个数是 65。

(二)推理时间,随难度显著增加

具体实战时,DeepSeek-R1-Lite完成竞赛数学平均推理时间仅3min,考研数学题的平均推理时间是1min。

高中数学竞赛:

考研数学:

(三)推理过程可能存在中英混杂的情况
一些推理模型也会有偶现的输出问题。例如,DeepSeek-R1-Lite在完成中文试题时,推理部分会存在中英夹杂的情况,K0-math会出现中文试题全英回答。
DeepSeek-R1
prompt:
给定整数 n>2 和 l \in\{1,2, \cdots, n\} . 称 \{1,2, \cdots, n\} 的子集族 A_{1}, \cdots, A_{k} (允许相同) 是 l- 大的, 如果对任意 1 \leq i \leq k 有 \left|A_{i}\right| \geq l . 求最大的实数 c , 使得对任意正整数 k , 任意非负实数 x_{1}, \cdots, x_{k} , 以及 \{1,2, \cdots, n\} 的任意 l -大的子集族 A_{1}, \cdots, A_{k} , 均有\sum_{i=1}^{k} \sum_{j=1}^{k} x_{i} x_{j} \frac{\left|A_{i} \cap A_{j}\right|^{2}}{\left|A_{i}\right| \cdot\left|A_{j}\right|} \geq c\left(\sum_{i=1}^{k} x_{i}\right)^{2}
思维链路
这可能比较难以直接计算。






请到「今天看啥」查看全文