专栏名称: 大数据应用
数据应用学院被评为2016北美Top Data Camp, 是最专业一站式数据科学咨询服务机构,你的数据科学求职咨询专家!
目录
相关文章推荐
大数据文摘  ·  Andrej Karpathy ... ·  3 天前  
数局  ·  后浪研究所:2025年轻人毛绒玩具报告 ·  3 天前  
数据派THU  ·  【ICML2025】多模态表示坍塌的深度剖析 ·  昨天  
艺恩数据  ·  2025人生四双鞋:京东趋势白皮书 ·  3 天前  
51好读  ›  专栏  ›  大数据应用

100000个故事中的性别与动词分析:有一些很有意思的发现

大数据应用  · 公众号  · 大数据  · 2017-10-25 09:05

正文

请到「今天看啥」查看全文


举个例子,我们发现 “Animal Farm”的介绍中在“he”后面跟随了5个动词,比如 “he refers” 和 “he accuses”。(请注意我把这类跟在代词后面词统一称呼为动词,尽管有些词是连词或者副词)


性 别 关 联 动 词

哪些词跟在“he”或者“she”后面的次数最多呢?我们把出现超过200词的词筛选出来。

这个结果可以用柱状图展示。


这个图多少能反应点问题, 女性更可能被设定为受害者 - “she screams”, “she cries”, 或 “she pleads”。 男性更可能被设定为侵犯者 - “he kidnaps” or “he beats”。当然不是所有和男性关联的词组都是负面的,像“he saves”/”he rescues” 这样的结构就很正面,但他们也是动作的发出者而不是承受者。



我们可以比较下和 “he” ,“she”关联的所有单词的数量,这可以让我们找到在性别间变动最大的常用词。









请到「今天看啥」查看全文