专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
51好读  ›  专栏  ›  大数据文摘

9458份与家暴有关的离婚判决书:一篇沉重的数据分析

大数据文摘  · 公众号  · 大数据  · 2017-05-20 12:44

正文

请到「今天看啥」查看全文


这个世界真是很不友好,一开始我按照以往的思路写爬虫,但是没爬几篇,IP就被封了,于是我买了最贵的代理,优化了爬取策略,这才把数据爬下来(9458份)

数据爬下来之后,我做了大量的结构化工作:通过正则匹配,我把一篇判决书分成三个部分:原告说的,被告说的,法院说的,并且我把法院引用的法律条文单独存了下来,这样一来,后面的分析就可以更有针对性了。


首先,根据对原告被告谁是施虐者,谁是受害者的判断,我发现,并不是所有的原告都是受害者,多达9.32%的被告才是家庭暴力的受害者:


打人的反而把被打的告上法庭,这是为什么呢?我阅读了一下信息,发现这其中很多都是由于被打的不堪忍受,最后奋起反击,或者直接杀掉了施暴者。这样的案例有不少。虽然我并不支持这样的行为,但是我不得不说一句,先不谈道德法制,家暴也有很大的惹上杀身之祸的风险的。


在原告和被告的供词中,我用匹配关键词的方式来分析他们是否有孩子,结果出乎我的意料:


居然大部分离婚官司的对象都有孩子,后来我也想到了缘故,如果没有孩子,很可能就直接协议离婚了,并不会闹到法庭上来,孩子是很多婚姻的维系,但也是一旦离婚,双方都会拼命争取的对象。值得一提的是,这些家暴且有孩子的家庭中,有女儿的比有儿子的略多,这个现象值得我们思考。







请到「今天看啥」查看全文