专栏名称: 阿里研究院
阿里研究院依托阿里巴巴集团海量数据、深耕小企业前沿案例、集结全球商业智慧,以开放、合作、共建、共享的方式打造具影响力的新商业知识平台。 阿里研究,洞察数据,共创新知! 官方网站http://www.aliresearch.com/
目录
相关文章推荐
电子商务研究中心  ·  国补携手618:消费新引擎背后的经济逻辑与未来趋势 ·  昨天  
电商派Pro  ·  小红书最新估值达1800亿 ·  2 天前  
淘宝教育商家成长  ·  淘宝教育2025新讲师招募正式启动! ·  2 天前  
51好读  ›  专栏  ›  阿里研究院

新成员QwQ,邀你一起思忖未知之界

阿里研究院  · 公众号  · 电商  · 2024-11-28 16:02

正文

请到「今天看啥」查看全文



具体表现如下:

GPQA: 65.2%,展示了研究生水平的科学推理能力;

AIME: 50.0%,证明了强大的数学问题解决技能;

MATH-500: 90.6%,体现了在各类数学主题上的全面理解;

LiveCodeBench: 50.0%,验证了在实际编程场景中的出色表现。


这些成果充分体现了QwQ在分析和问题解决能力方面的显著进步,尤其是在需要深度推理的技术领域。



样例

下列样例展示了QwQ深度自省的能力——质疑自身假设、进行深思熟虑的自我对话,并仔细审视其推理过程的每一步。


Example1: Logical Reasoning

User

S先生、P先生、Q先生他们知道桌子的抽屉里有16张扑克牌:红桃A、Q、4 黑桃J、8、4、2、7、3 草花K、Q、5、4、6 方块A、5。约翰教授从这16张牌中挑出一张牌来,并把这张牌的点数告诉 P先生,把这张牌的花色告诉Q先生。这时,约翰教授问P先生和Q 先生:你们能从已知的点数或花色中推知这张牌是什么牌吗?于是,S先生听到如下的对话:

P先生:我不知道这张牌。

Q先生:我知道你不知道这张牌。

P先生:现在我知道这张牌了。

Q先生:我也知道了。

请问:这张牌是什么牌?


QwQ-32B-Preview

这道题是逻辑推理题,涉及到信息的逐步披露和推理。题目中有一副16张扑克牌,分别是:

红桃:A、Q、4

黑桃:J、8、4、2、7、3

草花:K、Q、5、4、6

方块:A、5

约翰教授选了一张牌,把点数告诉了P先生,把花色告诉了Q先生。然后通过他们的对话,我们要推断出是哪张牌。


首先,让我们来梳理一下对话的内容:

P先生说:“我不知道这张牌。”

这意味着点数是重复的,因为如果点数唯一,P先生就能确定是哪张牌。例如,如果点数是K,只有草花K,那P先生就能确定是草花K。但P先生说不知道,所以点数必须在多个花色中出现。看看哪些点数是重复的:

A:红桃和方块

Q:红桃和草花

4:红桃、黑桃和草花

5:草花和方块

其他点数都是唯一的在某个花色中。

所以,可能的点数是A、Q、4、5。


Q先生说:“我知道你不知道这张牌。”

红桃:A、Q、4

黑桃:J、8、4、2、7、3

草花:K、Q、5、4、6

方块:A、5

A:红桃和方块

Q:红桃和草花

4:红桃、黑桃、草花

所以,红桃花色中的所有点数都是重复的。

4:黑桃、红桃、草花

其他点数在黑桃中是唯一的。

但Q先生说他知道P先生不知道,所以花色中的所有点数都必须是重复的。但在黑桃中,除了4,其他点数都是唯一的。所以,如果花色是黑桃,且点数是J、8、2、7、3,那么P先生就能知道,这与Q先生的说法矛盾。因此,花色不能是黑桃。

Q:草花和红桃

4:草花、红桃、黑桃

5:草花和方块

K和6是唯一的。

所以,如果花色是草花,点数是K或6,P先生就能知道,这又与Q先生的说法矛盾。因此,花色不能是草花。

A:方块和红桃

5:方块和草花

所以,方块中的点数都是重复的。

这句话有点 tricky。Q先生知道花色,而且他说他知道P先生不知道。这意味着,根据Q先生知道的花色,可以确定点数一定是重复的。因为如果花色中的点数是唯一的,那么P先生就能知道是哪张牌。但Q先生肯定地说他知道P先生不知道,所以花色中的点数必须是重复的。


让我们看看每个花色中的点数情况:

综上所述,Q先生知道花色,且确定所有可能的点数都是重复的,所以花色只能是红桃或方块。

P先生说:“现在我知道这张牌了。”

A:红桃和方块

Q:只有红桃

4:红桃

5:方块

P先生原来不知道,但现在知道了。这意味着,在Q先生发言后,P先生通过点数和花色的可能组合,确定了是哪张牌。

我们已经知道花色只能是红桃或方块,点数是A、Q、4、5。

但P先生现在知道牌了,说明点数加上花色的限制,使得只有唯一一个可能性。


让我们看看点数在红桃和方块中的分布:

等一下,Q先生说花色只能是红桃或方块,但根据之前的分析,花色是红桃或方块。

但是,点数Q只有红桃,4只有红桃,A有红桃和方块,5只有方块。

P先生原来不知道,说明点数是重复的,即A或5。

如果点数是Q或4,只有红桃,那么P先生知道点数后,结合花色是红桃,就能知道是哪张牌,这与P先生第一句“我不知道这张牌”矛盾。

所以,点数不能是Q或4,只能是A或5。

现在,P先生说他知道牌了,说明在A或5中,结合花色,只有唯一可能性。

但A在红桃和方块都有,5只有方块有。


等一下,如果点数是5,只有方块5,那么P先生知道点数是5,结合花色是方块,就可以确定是方块5。

如果点数是A,花色可以是红桃或方块,那么P先生还是不能确定是哪一张。

但是,P先生说现在知道这张牌了,所以点数不能是A,因为A在红桃和方块都有,除非花色是方块,但P先生只有点数信息。

等一下,也许我需要更仔细地思考。

Q先生说花色是红桃或方块,因为只有这些花色的点数都是重复的。

P先生知道点数,现在他说知道了,说明在花色是红桃或方块的限制下,点数唯一确定了牌。

对于点数A,花色可以是红桃或方块,所以P先生不能确定是哪一张。

对于点数5,只有方块5,所以P先生知道是方块5。

因此,只有当点数是5时,P先生才能确定是方块5。

所以,牌是方块5。


Q先生说:“我也知道了。”

Q先生原来只知道花色,但不知道是哪张牌,现在他也知道了。

如果花色是方块,点数是A或5。

但P先生刚才已经确定是方块5,所以Q先生现在也知道了是方块5。

如果花色是红桃,点数是A、Q、4。







请到「今天看啥」查看全文