专栏名称: 新闻实验室
这里是方可成的新闻实验室,期待与你产生化学反应!在这里你可以读到关于新闻、媒体、科技、文艺、社会等多方面的跨界话题,有趣有料。
目录
相关文章推荐
人民日报  ·  6岁女童被男子拖进巷子,警方通报! ·  2 天前  
新华社  ·  5类食物是“失眠帮凶”,睡前少碰! ·  2 天前  
51好读  ›  专栏  ›  新闻实验室

怎样才能保证自己的裸照不被泄露?

新闻实验室  · 公众号  · 社会  · 2018-04-01 09:40

正文

请到「今天看啥」查看全文



这个小程序及其成功,据Stillwell自己统计,有六百万用户使用过。其中一小部分用户同意捐出他们在Facebook上的行为数据供研究使用。


这两部分数据(心理性格测试,Facebook行为)相叠加,就形成了myPersonality数据集,约有数十万用户的数据。这个数据集目前还有很多学者在用,包括我的实验室(http://www.mypersonality.org)。



就样本量而言,myPersonality数据集远远小于这次Facebook和剑桥分析的数据泄露(据说有五千万之多)。但 对于社会科学研究者,这个数据集无疑是一个金矿。


这是为什么呢?传统的定量社会科学研究,收集数据的方法很有限,主要是实验和问卷两种。实验很难规模化,能达到几百人就相当不容易了。问卷方法也许可以收集几千人甚至上万人的数据,但是只能知道人们当时是怎么说的/想的(态度),而不是怎么做的(行为)。 填过问卷的人都知道,怎么说和怎么做经常是两回事。


但myPersonality数据集把性格量表和用户的Facebook行为结合在了一起。而且样本量之大,远远超过了传统定量研究。(样本量对社科的结论可信度有很大的影响,这里不展开了,有兴趣的可以关注一下心理学界最近的实验重复危机和p值的讨论)。



2008年,Michal Kosinski加入了剑桥大学,在心理测量中心读硕士。他和Stillwell带领了一个团队,用myPersonality这个金矿,在美国国家科学院院刊上发表了两篇极有影响的文章。


第一篇发表于2013年,题目是”Private traits and attributes are predictable from digital records of human behavior” 个人性格特质可以用行为数据来预测。 这篇的大意是,他们用行为数据(主要是Facebook上点赞)建了模型,来预测用户的性格和其他特质(比如性别,性取向,党派),得到比较高的准确率。比如说,赞Hello Kitty的人较神经质,更可能支持民主党而非共和党。


第二篇发表于2015年,题目是”Computer-based personality judgments are more accurate than those made by humans.“ 这篇的大意是,运用他们之前建立的模型来预测你的性格,竟然比你好友的预测还准确。基于电子足迹的算法模型比你亲近的人更了解你。



Kosinski和Stillwell的研究成果在当时取得了轰动,有两大原因。


第一,大家意识到海量行为数据建模能够精准的预测用户性别,年龄,性取向,政治倾向,购买意愿……之前不管是营销,广告公司,还是公关,民调机构,要了解用户,只能辛辛苦苦做访谈,问卷,焦点小组。不但劳民伤财,准确率也不够高。电子足迹不但精准,而且俯拾皆是,每个人都有。


这是大数据结合人工智能的一次胜利。过去的几十年(弱)人工智能已经发展到了一定高度,但是算法再先进,也遵循GIGO原则: 如果输入(数据)精度不够,输出(预测)也不会准确。


Kosinski和Stillwell所用的算法并不高深。但海量的电子足迹充分发挥了算法的优势。用户的心理画像很高的精准程度。


第二,他们的研究启发了很多人,原来科研还可以这么搞!Facebook的用户数据原来可以通过第三方app获取!要知道Facebook的海量行为数据极少对外界开放。虽然在Facebook上可以精准投放广告给用户,但是没有靠谱的行为模型做支撑,广告仿佛大炮打苍蝇,对绝大部分的受众都是打水漂。这一来,通过第三方app收集数据,给大家提供了一个崭新的思路。









请到「今天看啥」查看全文