专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
51好读  ›  专栏  ›  大数据文摘

爬下20万份菜谱,数据解读舌尖上的中国 | 饕餮文本大宴

大数据文摘  · 公众号  · 大数据  · 2017-03-02 06:37

正文

请到「今天看啥」查看全文



通过对食材的聚类分析,我们可以看出, 最受欢迎的调理是盐,其次是糖,酱油(PS:同类词已经合并,例如糖和白糖,都算做糖)

这从某种程度上说明了, 咸味比甜味还是更主流一点。

那么,人们最喜欢吃的肉是什么呢?我们把食材又做一次聚类,发现了如下事实:

可以看得出, 五花肉是不可撼动的存在,第二名排骨的份额也不错,达到了12.1%,其次是牛肉和猪肉 。虽然猪肉略逊于牛肉,但五花肉和排骨其实也是猪肉,因此,猪肉无可辩驳的是中国人的餐桌之王。令我比较吃惊的是虾仁有8.57%的份额,我小时候基本上很少吃虾仁,这世界变化快啊。

肉类看完了,那么对于蔬菜的选择又是怎样的呢?

看了结果我有一点愤怒,为什么这么 难吃的胡萝卜居然是第一?而且那么领先。又是为什么,香菜居然出现在了前十的名单里面。我最爱的土豆,居然只有 14.54% 的份额。这太让人震惊了。

另外我还发现了一个不得不说一下的事实,就是在描述用量的时候,出现最多的是「适量」,这个描述每次我看到都很头疼,适量到底是多少,为什么不能说的明白一点呢,我手一抖,倒下去半瓶醋,是不是也是适量?


看完了食材,我们看一下中国人最常做的菜是什么:







请到「今天看啥」查看全文