专栏名称: InfoTech
以传播大数据、解读行业趋势、数据化运营为核心的新媒体平台,已有150多万行业人士关注,荣获2013年新浪微博百强自媒体、2016年中国十大大数据领域影响力平台,关注我就是关注数据
目录
相关文章推荐
数局  ·  飞书深诺:2025欧洲春夏时尚潮流图鉴 ·  19 小时前  
数据派THU  ·  【ICML2025】解决3D语言高斯溅射中的 ... ·  3 天前  
国家数据局  ·  数据标注优秀案例集之三十二 | ... ·  3 天前  
51好读  ›  专栏  ›  InfoTech

分析了街道上口香糖渍,竟发现一道贫富鸿沟

InfoTech  · 公众号  · 大数据  · 2017-05-23 06:40

正文

请到「今天看啥」查看全文



大量的行人长年累月行走在这片人行道上,这种日积月累的增量会使得任何在一开始不太可能的事情最终变成现实。所以,即便我们仅仅假设一百万人里面只有一人会把口香糖吐到地面上,五年的总量也是惊人的。而这也让人行道成了我们现在看到的样子。


我们试着模拟了一下这个过程,假设每周两百万行人穿过一片平地,只有百万分之一的人会在这里留下痕迹,那么在五年之中,路面上的口香糖渍就会像下面这个动图所显示的这样(其中痕迹的位置和半径都是随机设定的):



在260周(5年)的模拟试验中,一共产生了54个口香糖痕迹。我们又做了几百次相同的模拟试验,其中有95次模拟都产生了40以上个口香糖渍。也许我们的“实验地点”只是一个虚拟的地理位置,但它仍然具有现实意义:在纽约,几十个商业区的客流量要远比我们假设的多。


比口香糖渍的普遍性更有趣的,则是它们的分布特征:哪些地区分布密集、哪些地区稀疏?在哪里会出现这种不平衡?为什么会这样呢?


我们真的去数了这些口香糖渍!


我们遇到的第一个难题就是选择样本。在时刻变化的城市地形地貌中,我们需要选择具有一定连贯性的实验对象:最好是能找到一条足够长的人行道,然后观察口香糖渍的数量随着穿过的社区的不同,而产生的变化——比如一条横穿城市的大街公园大街(Park Avenue)。



公园大街有着象征富贵的悠久历史,多年来,已经成为“旧贵”(old money)的代名词。虽然如今很多其他街区也开始变得富有,但根据一项2014年的街区富裕程度排行,公园大街横穿曼哈顿地区平均家庭收入最富有的两个街区Lenox Hill和Carnegie Hill,百年来依然是财富最聚集的地区。


我们现在将根据街道上的口香糖渍数量来评价街区。但本着统计学家的精神,我们不会统计公园大街上的每一寸街道,而是选择有代表性的样本进行抽样。考虑到人行道上铺设的方砖都是同样大小且遵循着相同的规律,我们选择了系统抽样(systematic sampling)的方法。我们真的去数了这些口香糖渍!







请到「今天看啥」查看全文