专栏名称: 网易科技
网易科技频道,有态度的科技门户。
目录
相关文章推荐
yikai 的摸鱼笔记  ·  专访Granola ... ·  昨天  
yikai 的摸鱼笔记  ·  专访Granola ... ·  昨天  
新浪科技  ·  【#格力钛回应18.06亿股权被冻结#:原实 ... ·  2 天前  
36氪  ·  山姆在中国,只用了这几招 ·  2 天前  
51好读  ›  专栏  ›  网易科技

只需 20 行代码,就能读懂复仇者联盟的人物关系!

网易科技  · 公众号  · 科技媒体  · 2019-04-28 12:05

正文

请到「今天看啥」查看全文


)

visNetwork是一款非常优秀的关系图渲染插件,在之前的博客中已经有所介绍了,详见https://blog.csdn.net/BEYONDMA/article/details/89431724,这里不加赘述了。我们可以看到,灭霸、钢铁侠、雷神均是各自阵营的核心节点,具体效果如下:读者大可以按照上面的代码自己试一下。

复联4中人物的深入分析

想要深入分析人物的性格与关系,还是需要有大量的影评及语料数据做为基础的,这里我们还是选取豆瓣上的影评数据,由于很多评论都涉及相关剧情了,为避免剧透,具体的爬虫过程就省略了,抓取到影评的文本数据后,我先做了个词云。具体过程详见博客文章:https://blog.csdn.net/BEYONDMA/article/details/85400923,可以看到“最后、最终、最好”成为了关键词,从这个角度也可以看出,这次的复联4的确是漫威的巅峰之作。

想了解一个人物,看他和身边的朋友就能了解个大概,而文本分析中的wordtovector就是这样一种算法,用一个长度固定window来用观察一个词经常和哪些其它词同时出现,来将词转为向量,详见博客文章:https://blog.csdn.net/BEYONDMA/article/details/88074516的第四部分。那么这时候我们就可以将刚刚抓取到的影评文本,训练为词向量模型。

> model<-word2vec(layer1_size=200,train_file='f:






请到「今天看啥」查看全文