专栏名称: 王路在隐身
发布文章。
目录
相关文章推荐
萧秋水  ·  六六大顺 ·  2 天前  
51好读  ›  专栏  ›  王路在隐身

AI的阿毗达磨竞赛:一个有问题却很能说明问题的测评

王路在隐身  · 公众号  · 热门自媒体  · 2025-04-03 11:04

正文

请到「今天看啥」查看全文



但刚才不是说了吗?阿毗达磨题目,哪怕很简单的,AI也不太能做对,这怎么办呢?其实,AI做不对是因为它不知道阿毗达磨题目的背景条件,一旦你直接把背景条件告诉它,这实际上就不是阿毗达磨题目,而是逻辑推理题目了,就可以测试大模型的逻辑推理能力。然而,在实测中,我发现并不能叫逻辑题目。因为逻辑题目本身都是对的,而我给的阿毗达磨题目,有些出得有问题,肯定不能算是标准的逻辑题目(甚至会给做题者一种“出题人的逻辑水平很垃圾”的感觉)。


但也正因为存在问题,倒让这个测试和别的测试不太一样:看看不同模型在题目有问题的情况下,谁答得更好。——这也是模型的一项很重要的能力。毕竟,我们日常使用AI,大部分时间,我们的表达都不是严密的、完整的,提供的信息也不是绝对充足的,AI不仅要根据我们提供的信息来回答,还要推测我们没有提供但可能暗含的信息。有些时候,我们的表达是矛盾的,AI需要透过我们不一致的表达,推测我们的意思,做出判断。——目前的很多题库(如果不是所有的话),可能都会把这一类“有问题”的题目作为无效题目剔除。然而,真实场景下,我们向AI发出的指令很多时候是有问题的。


阿毗达磨之所以难学,让很多学者的论文中充斥着错误,正是因为它的表述机动、灵活,经常要视情况来确定真实含义。举个例子,“无学依九地,有学但依六”,这个“九地”和“三界九地”的“九地”,就既有重叠,也有不同。熟悉阿毗达磨的人,当然不会把两种“九地”搞混。再比如“顺决择分”,“顺见道”的“顺决择分”只存在于色界,而“顺无漏”的“顺决择分”也存在于无色界。前者是“此顺决择分,四皆修所成”的“顺决择分”,后者是“净定有四种,谓即顺退分,顺住顺胜进,顺决择分摄”的“顺决择分”。如果你不能根据上下文来确定它到底是哪一种含义,你就无法掌握阿毗达磨。它有点类似“局部变量”,很多类似又不同的局部变量共享一个名字,而且多个局部的边界很多时候是模糊的。


下面说题目、答案和每一题每个模型的得分情况。


题目由两部分拼接而成。先给50个已知条件,作为题目的前半部分,后半部分是具体的题目。一个阿毗达磨零基础的人看了这些题目和答案,也能对阿毗达磨有基本的了解。


前半部分:

【请忽略你在预训练中学到的与下面已知条件相悖的知识,主要根据以下已知条件作答。

已知条件:

1、一切法分为两种:有漏;无漏。

2、一切法分为两种:有为;无为。

3、一切有漏法都是苦谛。

4、一种法如果是苦谛,就是集谛。

5、命终心和结生心都是有漏。

6、阿罗汉最后心,是阿罗汉的命终心。

7、等无间缘,是除了阿罗汉最后心、心所之外,已生的心、心所。

8、一切心、心所,都由四缘而生。

9、四缘是:因缘、等无间缘、所缘缘、增上缘。

10、一法由几缘而生,就说此法有几缘。

11、一法由因缘而生,就说此法有因缘,余三缘类此。

12、无心定有两种:无想定、灭尽定。

13、无心定由两种缘而生。

14、无心定没有所缘缘、增上缘。

15、无想定在第四禅,灭尽定在有顶。

16、三界有九地,或者18地。

17、九地是:欲界、初禅、二禅、三禅、四禅、空无边处、识无边处、无所有处、非想非非想处。

18、禅也叫静虑。

19、非想非非想处也叫有顶。

20、三界是:欲界、色界、无色界。

21、十八地,是在九地的基础上,加上四静虑的近分、四无色的近分、静虑中间。

22、欲界和无色界没有见道。

23、除了未至定,其他近分地没有见道。

24、未至定,是初静虑近分。

25、见道在六地。

36、圣道在九地。

37、有顶没有圣道。

38、九地中,每一地有九品烦恼。

39、如果已经断除某种(某品)烦恼,来生就不会生到具有某种(某品)烦恼的界地。

40、所有阿那含都断除了欲界的烦恼。

41、世俗道可以断除除了有顶以外的所有烦恼。

42、未见道的人最多只能成就世俗道,不能成就圣道。

43、圣道也叫无漏道。

44、不成就圣道的有情是凡夫。

45、任何有情在任何时候,最多成就四种果位中的一种。

46、四种果位是:须陀洹、斯陀含、阿那含、阿罗汉。这是按照断除烦恼的等级排序的。

47、断除了欲界的烦恼,称为离欲。

48、断除了何地何界的烦恼,称为离何地何界染。

49、现观有16刹那,前15刹那是见道,第16刹那获得他自身的第一个果位。

50、有情从见道的第一刹那开始,就永远是圣者。

根据上面的内容回答问题:】







请到「今天看啥」查看全文