专栏名称: Mr. Bias 的经济学轻科普
你好,这里是我们推演出的关于你们的故事,谢谢。
目录
相关文章推荐
潇湘晨报  ·  金价大跌! ·  3 天前  
湖南日报  ·  “考场出来沉默了”,高考数学爆上热搜 ·  3 天前  
51好读  ›  专栏  ›  Mr. Bias 的经济学轻科普

动态一致性、RCL与结果主义:非期望效用理论中的“不可能三角”

Mr. Bias 的经济学轻科普  · 知乎专栏  ·  · 2017-01-17 03:06

正文

请到「今天看啥」查看全文


那我们应当以怎样的方式去提高模型对理性的要求呢?一些简单的法则可以被应用于此,就比如一个理性的决策者应该会永远选择一节随机占优的彩票,这是因为简单的“更多的钱总是最好”。但是绝大多数非期望效用理论满足这个条件,即便1979年最初版本的前景理论做不到这一点,参见: 如何理解「累计前景理论」? - 陈茁的回答 - 知乎



二、决策树:一个简单介绍

在提出关于理性的进一步介绍之前,我打算定义决策树这个后面无处不在的东西。这里的符号设定遵循了Hammond (1988):

----------------------------------------------------------------------------------------------------------

定义 :一个 决策树 T 是一组概念的集合,即 T=\left<N,N^*,N^0,X,N_{+1}(\cdot),n_0,\pi(\cdot|\cdot),\gamma(\cdot)\right> 。其中:

  • N 是决策树 T 中所有 节点 组成的集合,它由 N^*,N^0,X 三个部分组成;
  • N^* 是所有 决策节点 组成的集合,也就是说,决策者只能在决策节点上做决策;
  • N^0 是所有 机会节点 组成的集合;
  • X 是所有 终结点 组成的集合;
  • N_{+1}NN 本身的一个对应(correspondence),表示了每个节点的 直接后继 。满足:

  1. 对任意 n\in Nn\notin N_{+1}(n) (自己不是自己的后继);
  2. 对任意 n\in N ,满足 N_{+1}(n)=\emptyset 当且仅当 n\in X (只有终结点没有后继)
  3. 对任意 n,n'\in NN_{+1}(n)\cap N_{+1}(n')\neq\emptyset 当且仅当 n=n' (只有这样才能叫“树”);
  • n_0 是决策树中唯一的 初始节点 ,满足对任意 n\in Nn_0\notin N_{+1}(n) (初始节点不是任何节点的后继),初始节点可能是一个决策节点,也可能是一个机会节点;
  • 对任意 n\in N^0 (机会节点)和任意 n'\in N_{+1}(n) ,正实数 \pi(n'|n) 表示从节点 n 走到其后继 n' 概率 ,满足: \sum_{n'\in N_{+1}(n)}\pi(n'|n)=1
  • \gamma(\cdot) 是定义在 X (终结点)上的函数,其中对任意 x\in X\gamma(x) 表示终 x 对应的 结果
  • ----------------------------------------------------------------------------------------------------------


    决策树的方法,据我所知,应该是由数学家Raiffa在1968年的著作“Decision Analysis: Introductory Lectures on Choices under Uncertainty”中提出的。

    当然,决策树这三个字在知乎上的讨论,主要是机器学习那边儿的人在做。

    根据决策树的定义,我们还可以定义“概率树”:

    ----------------------------------------------------------------------------------------------------------

    定义 :一个决策树是一个 概率树 ,如果 N^*=\emptyset

    ----------------------------------------------------------------------------------------------------------

    也就是说,概率树是一个没有决策节点的决策树,换言之,决策者面对着一个概率树,当且仅当它只能看着不确定性一步一步地消解掉而不能够做任何事情以改变结果。

    我们来看一个例子,来自Hammond(1988,section 6):

    在这张图中,“空心圆”表示机会节点,“正方形”表示决策节点,“实心圆”表示终结点。我们可以看到,初始节点 n_0 是一个机会节点,在这个节点上,有 \alpha 的概率会走到决策节点 n_1 ,有 1-\alpha 的概率会走到最右侧的终结点。而在决策节点 n_1 ,决策者有选择到底走到左下方两个终结点中的哪一个。

    定义一个 行为规则 \beta ,给任何一个决策节点 n\in N^* 赋予选择的结果 \beta(n) ,满足:1. \beta(n)\neq\emptyset ,和 2. \beta(n)\subseteq N_{+1}(n) 。这两条要求分别对应着:1. 总要有个选择,和 2. 节点 n\in N^* 上选择的结果是 n 的一个或者一组直接后继。当我们要分析决策者在面临不同决策树时的选择,我们会把行为规则扩写成 \beta(T,n) 。另外,对于任何一个决策树 T 和其中的一个节点 nF(T,n) 表示在决策树 T 中走到节点 n 时还有可能走到的结果组成的集合。那么就有, F(T,n_0)=XF(T,x)=\{x\}


    如果对于决策树 T ,有 N^*=\{n_0\} ,也就是唯一的决策节点是初始节点,那么这个决策树被称作一个简单决策树。对于简单决策树,我们有 N_{+1}(n_0)\in N^0\cup X ,即 n_0 的后继要么是一个机会节点,要么是一个终结点。而又因为没有其他的决策节点存在了,所以两者都可以被视作一个结果集合上的概率分布。所以,这就是一个简单的“静态”决策问题了,此时我们可以将 \beta(T,n_0) 写作 C[F(T,n_0)] ,即以 F(T,n_0) 为“菜单”的一个传统的选择函数。

    最后,给定任意决策树 T 和树上的一个节点 \bar{n} ,我们说“节点 n\in N\bar{n} 的一个 后继 ”,如果存在一列节点 n_1,\cdots,n_k\in N ,使得:1. n_1=\bar{n} ,2. n_k=n ,和3. n_{j+1}\in N_{+1}(n_j) 对任意 j=1,\cdots,k-1 成立。这样,当给定了决策树 T=\left<N,N^*,N^0,X,N_{+1}(\cdot),n_0,\pi(\cdot|\cdot),\gamma(\cdot)\right> 和某个该决策树的节点 \bar{n}\in N ,我们可以定义决策树 Tn 为初始节点的 子树 或者 后继树 T(\bar{n}) ,使得 T(\bar{n})=\left<N(\bar{n}),N^*(\bar{n}),N^0(\bar{n}),X(\bar{n}),N_{+1}(\cdot|\bar{n}),n_0(\bar{n}),\pi(\cdot|\cdot,\bar{n}),\gamma(\cdot,\bar{n})\right> ,其中:

    • 新初始节点 n_0(\bar{n})=\bar{n}
    • N(\bar{n}) 为节点 \bar{n} 所有的后继和它本身组成的集合;
    • N^*(\bar{n})=N^*\cap N(\bar{n})N^0(\bar{n})=N(\bar{n})\cap N^0X(\bar{n})=N(\bar{n})\cap X 表示子树的决策节点、机会节点和终结点;
    • 对任意 n\in N(\bar{n})N_{+1}(n|\bar{n})=N_{+1}(n) \cap N(\bar{n})=N_{+1}(n) ,这是因为同一个节点在母树和子树上都一定有相同的后继;
    • \pi(\cdot|\cdot,\bar{n})=\pi(\cdot|\cdot) ,理由同上;
    • \gamma(\cdot|\bar{n})=\gamma(\cdot) ,理由同上。

    如果你能撑到这里,那么我们就进入正题~



    三、动态一致性:稳定偏好极其含义

    未来三节还是准备工作,但是距离我们的讨论的核心,也就是“不可能三角”已经非常接近了——这三节要介绍不可能三角的那三个角到底是什么。

    我们知道,在博弈论中,只有当博弈是“动态”的,我们才能够说“计划”这个词。比如,考虑这样一个博弈(摘自James Webb的Game Theory: Decisions, Interaction and Evolution, pp. 93):

    两个参与人序贯地做出行动,此时当轮到参与人1出招时,参与人2,虽然没有任何行动,但是是可以有一个计划的,而且容易发现,这个计划是“无论参与人1怎么选,我都选B”,也就是说参与人2永远选择B是一个严格占优的策略。也正是因为这个计划本身能够被参与人1知晓,所以子博弈完美的纳什均衡才是合理的,即均衡的策略剖面是(L,B)。

    所以说,一个计划未必是需要决策的时候才制定的,但它一定是针对着未来决策的可能性。用我们刚才定义的决策树来说,对决策树 T 的某个节点 n 来说,我们说“ n 上可以制定计划”,如果 N(n)\cap N^*\neq\emptyset ,也就是说,这个节点的后继中存在至少一个决策节点,即使这个决策节点不一定能达得到。

    根据上一节的定义,一个行为规则 \beta(T,\cdot) 就是针对决策树 T 的一个计划,它给每个决策节点赋予了一个关于“在这里往哪个方向走”的选择。如果这些选择中不存在无差异的偏好关系,或者说遇到了无差异的偏好关系决策者会选择按照某个概率分布随机地做出决策,那么我们就可以从这个行为规则中唯一地识别出一个概率树,因为如果在每个决策节点上,只要删除掉没有被选择的那些分支的话,每个决策节点就都只有一个直接后继,决策树也就退化成了一个概率树。这样,给定决策树 T 和行为规则 \beta ,我们把它们唯一决定的概率树称作 P(T,\beta)







    请到「今天看啥」查看全文