专栏名称: 数盟

数盟（数据科学家联盟）隶属于北京数盟科技有限公司，数盟致力于成为培养与发现“数据科学家”的黄埔军校。数盟服务包括：线下活动、大数据培训。官网：http://dataunion.org，合作：[email protected]

技术 | 从算法原理，看推荐策略

数盟 · 公众号 · 大数据 · 2017-07-10 21:37

正文

请到「今天看啥」查看全文

流行度推荐算法

这个很基础，看名字就知道了。这种方法是对item使用某种形式的流行度度量，例如最多的下载次数或购买量，然后向新用户推荐这些受欢迎的item。就和我们平时经常看到的热门商品、热门推荐类似。

浅析推荐算法在实际中的应用

了解了大概原理后，就可以来看看在实际场景中，推荐算法都是怎么使用的吧。(事先声明，这只是我看了相关东西再结合自己理解进去推测的，如果有说错的地方请各位千万放下手中的刀……)

好，下面开始，先说说协同过滤算法在实际中的应用。

协同过滤算法

协同过滤算法一般是怎么做的呢?我们先来看看在图书推荐中的做法：

协同过滤(CF)大致可分为两类：一类是基于邻域的推荐、一类是基于模型的推荐;邻域方法是使用用户对已有item的喜爱程度来推测用户对新item的喜爱程度。与之相反，基于模型的方法是使用历史行为数据，基于学习出的预测模型，预测对新项的喜爱程度。通常的方式是使用机器学习算法，找出用户与项的相互作用模型，从而找出数据中的特定模式。(由于基于模型的方法我也不太理解，暂时不展开说明，感兴趣的可以查阅相关资料)

【基于邻域的推荐】–即是构建用户相似矩阵和产品相似矩阵

假设用户表现出了对一些图片的喜欢情况并进行了相应的评分，情况如下：

不同图书代表不同维度，评分则代表了特征向量在该维度上的投影长度，根据用户对不同图书的喜爱程度建立用户的特征向量，然后根据余弦相似度可以判断用户之间的相似性。根据相似性可以建立用户相似矩阵：