专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
数据派THU  ·  CUDA重大更新:原生Python可直接编写 ... ·  3 天前  
大数据文摘  ·  0产品、0用户、0API!欧洲 AI ... ·  3 天前  
51好读  ›  专栏  ›  大数据文摘

百余名人辞世,刚过去的2016是被诅咒的一年吗?MIT数据分析预测这只是个开始……

大数据文摘  · 公众号  · 大数据  · 2017-01-25 06:40

正文

请到「今天看啥」查看全文


当然这些数据有其局限性。尽管过于简单,不够完美,然而这种基于维基百科多语言条目介绍的样本选取,已经是当前衡量一个人的名望或纪念性(因为维基百科是文化纪念的一种形式)最靠谱的形式。比如歌手大卫·鲍伊。在维基百科上你可以读到关于他的104种不同语言的相关介绍。演员吉恩·怀尔德呢?84种。经济学家托马斯•谢林呢?48种。当然,这并不意味着比起谢林,鲍伊的工作更多或更重要。简单意味着知道鲍伊的歌的人,比知道谢林的理论的要多(这很正常,因为鲍伊的一些歌流行全世界)。


名人数量增多

是否只是因为全球

人口基数的变大?

第二个问题是 名人变多只是因为全球人口总数变多了 我们的数据表明,情况并非如此。几个世纪以来,名人的数量增速已超过全球人口增速 。大家可以先看下这篇文章 ,还有这个视频。印刷术的发明之前,每年名人的数量仅占全球人口的一小部分;而在那之后200年也没太大变化 。然而17世纪后期开始,新生名人的增速是全球人口增速的平方。新生名人的数量,除以当时世界人口总数随时间线性增加。此外,比例常数中还增加了新通信技术。短篇印刷物,比如杂志和报纸在17世纪晚期的出现;新通讯技术的诞生,如电影、广播和电视都使斜率变大 。这些因素使得20世纪以来名人的增速变得前所未有。

我们已对这些疑虑做了说明,因此可以沉下心来对数据进行分析,来看看到底有多少名人预计在2017年辞世。


数据分析预测

有多少名人可能在2017年辞世?

图1是自2000年以来在20个以上的维基百科不同语言版本中过世的人数。 这个数字呈现了自2000年到2015年以来过世名人数从86人到195人的线性增长。 而2016年,我们观察过世的名人数实际上比预期的要少。所以我们觉得这一年过世的名人更多只是一种错觉。

图1:年名人过世数(纵轴:过世人数;横轴 :过世年份)

图2:年过世名人数( 横纵坐标同上)

红色:L>20 有20种以上维基百科语言版本的名人过世数

蓝色:L>35有35种以上维基百科语言版本的名人过世数

黄色:L>50 有50种以上维基百科语言版本的名人过世数

绿色:L>70 有70种以上维基百科语言版本的名人过世数

这种错觉可能是因为今年过世的人名气更大。 毕竟,你可以在100多个语言版本的维基百科中读到大卫·鲍伊;而图1的样本我们只选取了20个。所以并不是所有过世的名人都能达到是鲍伊的知名度。图2我们使用了更高的阈值重复之前的分析:超过20种语言,35种,50种和70种。最后一个类别(超过70种),超级巨星,那些我们可能在新闻中听到的名人,他们的过世讯息可能会在社交媒体中交互出现。2016年有点特别。死于2016年的超级巨星(L > 70)有16人,而2015年、2014年和2013年,这个数字分别为9人、10人、14人。

2016年过世的超级巨星,按知名度(L)排列如下:

那么全球每年过世名人他们的年龄中位数,或出生年份这段时间改变了?我们观察到了越来越多老年人的过世吗? 在某种程度上是这样的。通过图3我们观察到,在2000年去世的名人他们的出生中位数是1920年,就意味着他们的死亡中位数年龄是80岁。而2015年和2016年,名人的出生中位数年份是1932年和1930年,即死亡中位数年龄为83岁和86岁。因此,已故名人的死亡年龄上升了。

这个上升是很重要的,然而,这主要是因为我们现在看到的那些过世的名人他们的黄金时期是60年代,70年代和80年代,他们的名气主要来自电视。







请到「今天看啥」查看全文