正文
这就是所谓的概率的古典解释:概率是频率的极限。人们可确知的是频率,通过重复实验得到随机样本的频率,当样本足够大时,频率因大数定律收敛于概率。现代统计学和计量经济学就是根据这样的逻辑构建起来的。
那么,有一个自然的问题:这种频率收敛于概率的逻辑是否穷尽了人类关于不确定性的全部知识?不禁要问,当盖茨决心辍学设计windows系统之前,他知道这个系统能给他带来多少财富吗?肯定不知道,这个产品有不被市场接受的可能性,也就是说,他面临不确定性或者“危险”。
那他知道通过这个系统所能挣到的财富的概率分布吗?或者说,他有知道这个概率分布,即获取知识的可能性吗?
经济学家认为,人类有三种获取知识的方式:主动获取、被动接受、有意试错。
那么,他能花钱找人告诉他结果吗?不能,除非他相信算命先生,否则没有人比他自己更清楚windows的市场价值。
他能被动等待别人设计出windows然后看结果吗?不能,一来可能也没有什么人能够设计出一个一模一样的东西,再者就算有了你也只有一个样本点,拿一个样本点做回归,到学术会议上早让人喷死了。
有意试错呢?肯定也不行,因为这个东西是不能够做实验的。他不能涉及并发表windows五千次,构成一个大样本,然后统计出概率分布,再决定是不是设计windows。首先,连续实验五千次是不可能的,因为市场上有windows时windows的销量,与没有windows时的销量肯定不是独立同分布的。再者,他受限于时间的不可逆性——盖茨不能穿越到未来五千次,看结果然后再穿越回来决定是不是做这件事。
这就是企业家面临的独一无二的核心问题:企业家的核心职能是为创造,为了获得超额利润,企业家必须原创性地做出能够满足消费者欲望的产品。这个产品必须是别人没有想到过的,企业家才能获得由于其原创性而获得的租值。而创造性行为,不能够做实验,一旦实验过了,idea就不是原创的了。
这就是芝加哥学派的鼻祖Frank Knight在1921年的那部《风险、不确定性与利润》当中区分风险和不确定性之间的关系所基于的知识背景。Knight从而论证,企业家在市场中获得高额利润,并不只是因为他们承担了市场活动的风险(事实上哪怕股民也承担着风险),而是因为他们承担了创造性活动的不确定性,
这种不确定性是不可能知道概率分布的,因为创造性活动不可能做实验。
后世的经济学家管Knight定义的不确定性作“奈特不确定性”。
奈特不确定性解释了为什么乔布斯这样的人,即便在市场中获得了“不合理”的报酬,但依然是推动社会进步的力量。这也解释了政府为什么不能对垄断企业的暴利持无原则的对抗态度,因为这将扼杀原创的精神。这个观点就是贾佳小盆友答题时所说的。
当然,有人会问:如果一个人试图成为企业家的努力是在“奈特不确定性”的基础上做出的,那么企业家们成功与否是不是主要取决于运气呢?
答:不好意思,就是这么回事。所以企业家的个人传记和演讲我通常不看。
引用阿尔钦1950年那篇著名的“不确定性、演化和经济理论”里面的观点:引入不确定性后,“利润最大化”作为行动指南的意义就没有了,企业也有了一个所谓的“均值-方差”效用函数。但这篇文章接下来的两个标题弥补了这里面的逻辑缺憾,他说:“判断成功的标准是结果而非动机”,“运气是实现成功的手段”。所以说,企业家的行为是否成功是基于他的创造是否偶然间契合了市场的需求,市场上的达尔文过程能够筛选出谁成功。关于这一点,初学者可以去买一本《当经济学遇上心理学和生物学》作为科普。
去年JEP上的一篇文章综述了关于企业家收入的一系列研究,结果和很多人的直觉相左:企业家的收入分布是具有极高偏度(Skewness)的,正所谓“张村有个张千万,旁边九个穷光蛋”,企业家是一个成材率极低的职业。平均来看,在美帝,自我雇佣的劳动力的平均收入低于为别人打工的劳动力,超过50%的新盈利机构(当然也算上了小区里买冰棍儿的大妈)都挺不过5年。
那么,看起来,企业家有超额利润这件事似乎不成立:是否他们的暴利只是因为他们运气好拿到了风投的钱,又运气好获得了成功?
显然不是,因为决定自我雇佣,也就是有勇气在奈特不确定性存在时冒险,是能够碰触这种好运气的先决条件,一辈子委身体制内的人永远没有这种运气。虽然暴利来自运气,但拥有好运可能性的先决条件是企业家敢于挑战奈特不确定性。
当然,人们为何喜欢这种有极大偏度的收益分布,是行为经济学家的工作。比较靠谱的理论是Quiggin在1982年提出的排序依赖的期望效用理论。
总结:企业家的超额利润=市场对不畏奈特不确定性而敢于创新的勇气的奖赏+市场对好运气或者毫无理由的远见的奖赏。
其中,勇气比运气更重要。
三、贝叶斯决策理论与埃尔斯伯格悖论
细心的读者应该已经注意到一个问题:Frank Knight的理论提出于1921年,柯尔莫哥洛夫的现代概率测度体系建立于1933年,也就是说,当Knight提出自己的理论时,他本人并不知道概率论还可以这么玩儿。
换言之,Knight所理解的概率还是“频率的极限”。
那么,是不是奈特不确定性可以被现代概率测度公理体系解决掉呢?
在这个问题上,有一些经济学家曾经做出过一些早期贡献,其中就包括了天妒英才拉姆齐和鲜有人知也是概率论专家的凯恩斯。不过,这个问题真正被彻底数学化是1954年萨维奇的贡献。
跑个题:事实上,长期以来,人们对概率就有两种截然不同的理解,一种叫频率主义,另一种叫贝叶斯主义。
大家学的计量几乎都是频率主义的东西:假设存在一个真实的参数,比如消费者对汽车和电瓶车的替代弹性,然后通过样本去估计这个参数。
贝叶斯主义不同,贝叶斯统计学家从来不认为这个真实的参数存在,他认为这东西最多只是一个概率分布,然后样本构成了进行贝叶斯推断的信息。
可是,做任何一个推断都是一个“后验概率”,都需要一个“先验概率”作为基础。通常,如果我们在处理数据之前对这个分布一无所知,统计学的惯例是取一个均匀分布(因为经济学中的变量多数是连续变量,如果是类似于计数变量一般取多项分布)。
要我说,这么做多少有些懒,如果我们不认可先验概率是均匀分布,那么,最早的那个“先验概率”从何而来?贝叶斯学派的数学家们会告诉你,这玩意儿是主观的。
因为先验概率的选取,如果样本不大,会影响最终的推断,所以贝叶斯推断是一个十足的主观的东西。这也是两大学派上百年痛快撕逼的根源。
为什么要跑题说贝叶斯概率论,因为拉姆齐、凯恩斯和萨维奇的努力恰好是要把概率主观化,核心的假设是人们拥有一个高于传统理性概念的“贝叶斯理性”。
在萨维奇的那本《统计学基础》中,他原创性地将“行为”定义为一个从“外在状态”集合
到结果集合
上的映射。这样,如果行为集合上的偏好
满足七个公理,其中包括“臭名昭著”的sure-thing principle,那么就可以找到一个概率测度
和一个Bernoulli效用函数
,使得对任意一个行为
和
,有
这就是著名的“主观概率期望效用理论”(SEUT)。Kreps在《决策理论讲义》里面评价这个模型:他应用于全部概率都是主观的情况。而到了1960年代,Anscombe和Aumann发展了这套理论,把行为定义做
到
上的全部概率分布
的映射。因为集合
是一个线性空间,因而新理论的公理化建构变得特别简单,而且里面不仅有主观概率,也有客观概率。也就是说,
其中
是当自然状态
实现时
的概率分布。
现代决策理论最基本的理论框架就是Anscombe-Aumann体系,想了解的朋友可以参阅MWG,6.E-6.F,或者Kreps(2013),第五章。