正文
当然这些数据有其局限性。尽管过于简单,不够完美,然而这种基于维基百科多语言条目介绍的样本选取,已经是当前衡量一个人的名望或纪念性(因为维基百科是文化纪念的一种形式)最靠谱的形式。比如歌手大卫·鲍伊。在维基百科上你可以读到关于他的104种不同语言的相关介绍。演员吉恩·怀尔德呢?84种。经济学家托马斯•谢林呢?48种。当然,这并不意味着比起谢林,鲍伊的工作更多或更重要。简单意味着知道鲍伊的歌的人,比知道谢林的理论的要多(这很正常,因为鲍伊的一些歌流行全世界)。
名人数量增多
是否只是因为全球
人口基数的变大?
▼
第二个问题是
名人变多只是因为全球人口总数变多了
。
我们的数据表明,情况并非如此。几个世纪以来,名人的数量增速已超过全球人口增速
。大家可以先看下这篇文章 ,还有这个视频。印刷术的发明之前,每年名人的数量仅占全球人口的一小部分;而在那之后200年也没太大变化 。然而17世纪后期开始,新生名人的增速是全球人口增速的平方。新生名人的数量,除以当时世界人口总数随时间线性增加。此外,比例常数中还增加了新通信技术。短篇印刷物,比如杂志和报纸在17世纪晚期的出现;新通讯技术的诞生,如电影、广播和电视都使斜率变大 。这些因素使得20世纪以来名人的增速变得前所未有。
我们已对这些疑虑做了说明,因此可以沉下心来对数据进行分析,来看看到底有多少名人预计在2017年辞世。
数据分析预测
有多少名人可能在2017年辞世?
▼
图1是自2000年以来在20个以上的维基百科不同语言版本中过世的人数。
这个数字呈现了自2000年到2015年以来过世名人数从86人到195人的线性增长。
而2016年,我们观察过世的名人数实际上比预期的要少。所以我们觉得这一年过世的名人更多只是一种错觉。
图1:年名人过世数(纵轴:过世人数;横轴
:过世年份)
图2:年过世名人数(
横纵坐标同上)
红色:L>20 有20种以上维基百科语言版本的名人过世数
蓝色:L>35有35种以上维基百科语言版本的名人过世数
黄色:L>50 有50种以上维基百科语言版本的名人过世数
绿色:L>70 有70种以上维基百科语言版本的名人过世数
这种错觉可能是因为今年过世的人名气更大。
毕竟,你可以在100多个语言版本的维基百科中读到大卫·鲍伊;而图1的样本我们只选取了20个。所以并不是所有过世的名人都能达到是鲍伊的知名度。图2我们使用了更高的阈值重复之前的分析:超过20种语言,35种,50种和70种。最后一个类别(超过70种),超级巨星,那些我们可能在新闻中听到的名人,他们的过世讯息可能会在社交媒体中交互出现。2016年有点特别。死于2016年的超级巨星(L > 70)有16人,而2015年、2014年和2013年,这个数字分别为9人、10人、14人。
2016年过世的超级巨星,按知名度(L)排列如下:
那么全球每年过世名人他们的年龄中位数,或出生年份这段时间改变了?我们观察到了越来越多老年人的过世吗?
在某种程度上是这样的。通过图3我们观察到,在2000年去世的名人他们的出生中位数是1920年,就意味着他们的死亡中位数年龄是80岁。而2015年和2016年,名人的出生中位数年份是1932年和1930年,即死亡中位数年龄为83岁和86岁。因此,已故名人的死亡年龄上升了。
这个上升是很重要的,然而,这主要是因为我们现在看到的那些过世的名人他们的黄金时期是60年代,70年代和80年代,他们的名气主要来自电视。