正文
那么,大数据时代的到来,又会给传统的经济计算之争增添哪些新的元素呢?
搜集分散化的经济信息并将其转换为可以计算的“数据”是实现计划经济体制下理性经济计算的前提。可是,大数据能否帮助我们达成这一前提呢?从技术上说,大数据确实可以收集与经济活动相关的海量信息(甚至是“全数据”),但是,运用大数据收集信息的实际操作要比理想情况困难得多。
我们先从一个最简单的经济学的情境——不存在任何信息变化的静态均衡状态,即哈耶克的所谓的“给定数据”的情况——来讨论大数据获得完备经济信息的可能性。在此情境下,如果大数据技术真的可以获取关于经济活动的“全数据”,那么其在原则上可以代替市场价格机制,从而实现科学理性的计划经济。但问题是,大数据根本不是什么真正意义上的全数据,而是有偏的选择性样本数据,很多时候甚至在数据质量上弱于随机抽样的小数据。首先,大数据所获得的信息是有噪音的——在很多互联网商业平台上,都存在网络水军“刷回复”“刷好评”“刷订单”的现象。由于制造噪音的低成本高收益,数据噪音往往比有效信息增长得更快。其次,大数据所获得的信息有样本选择性偏误。网络用户有显著的年龄和学历特征,故互联网大数据无法体现统计意义上的代表性(例如,女性是“双十一”在淘宝网上购物的主力,知识分子较多选择国外的搜索引擎)。再次,大数据无法获得某些关键的经济信息。许多家庭内部的决策(如教育资源在子女间的分配)和企业内部的决策(如中低层职位的变动)信息是无法在网络上通过大数据获得的,但这些决策显然具有重要的经济意义(影响人力资本积累和企业生产效率)。
显然,大数据在技术上无法保证获取足够丰富的高质量的经济信息,从而无法为计划经济的理性计算提供数据支撑。
不仅如此,一旦我们跳出最简单的新古典经济学模型,我们就会发现:那种认为大数据可以复兴计划经济的观点,实在是体现了对知识在市场运行中的作用的不充分理解。哈耶克提醒人们注意一个常识:在任何经济体制下,用于经济计算的数据化信息,都属于分散的个人知识,即我们每个人都只掌握关于市场的极小部分的知识。区别于可以成为公共知识的“科学知识”,这种分散的个人知识被称为在特定时空下有关各种“情势的知识”。因此,与存在劳动分工一样,需要有所谓的“知识分工”。
那么,情势的知识如何才能被有效利用呢?答案是市场的价格机制。从功能上看,市场的价格体系应被视为一种交流信息的机制。价格机制的优势在于,市场中的个人参与者只需要掌握少量信息就可以达成正确的行动。即是说,市场价格机制使得我们可以形成自发的交流,以最低的信息成本使个人所掌握的各种分散知识得到有效的利用。所以按照哈耶克的观点,以大数据来复兴计划经济完全就是“世上本无事,庸人自扰之”。
当然,如果一个计划部门真的搜集了全部的相应信息且其质量可靠(姑且不考虑信息的搜集成本),那么在逻辑上也可能达到与市场价格机制同样的效果。但是,一方面,正如我们已经说明过的,现有的大数据技术并不能搜集到全域和保质的信息;另一方面,更根本的是,哈耶克所说的分散的个人知识在很多时候是一种“默会知识”,其在逻辑上不可能被包括大数据在内的任何信息获取技术所得到。
在一九六〇年的《自由秩序原理》和七十年代的三卷本的《法律、立法与自由》中,哈耶克吸收波兰尼的“默会知识”概念,丰富了其对知识问题的理解。默会知识不仅具有分散的个人属性,更重要的是其无法被充分地向他人描述,即那是一种关于“怎么办”的知识而非“那是什么”的知识。故而面对默会知识时,我们所能知者远甚于我们所能言者。例如,学习游泳、骑车、弹奏钢琴乃至感受权威的学问之道等所习得的,都是不可言传的个人知识。因为在学习这类知识的过程中,我们无法用可以说明的道理来解释我们成功的原因。
默会知识的经济学含义在于,商业上的成功因素往往不是参与者所能察觉到的,且即使能察觉到,参与者也只是在实践中知道该怎么办,却无法用可被他人所理解的方式去表达。例如,在新古典经济学理论中,所有厂商的生产函数是同质的,而实际上,由于默会知识的存在,各个厂商的生产技术的知识必然是异质的个性化的,从而才有生产效率的差异。类推之,在销售、财务、组织生产等领域都没有给定的关于生产技术和经营手段的公共知识,只有默会的个人知识,从而不会有可辨识的同质化的数据信息。
既然默会知识无法被外部观察者所理解,那么他人就更不可能利用任何技术手段将这种知识数据化,大数据技术也不例外——这不是技术能力的问题,而是一种逻辑上的不可能。基于默会知识的存在,无论未来大数据技术如何发达,任何个体心智或计划部门都不可能获得“完备知识”,相反,却会处于“必然无知”的状态。于是,对于任何个体心智或计划部门,让计划经济可行的知识要求都不可能经由大数据技术所搜集的数据信息达成。