专栏名称: DigiMax Global

第一家聚焦于基于数据和大数据的互联网营销、运营、产品和管理的中立平台。旗下包括三个品牌：CWA（网站分析在中国）——知识分享平台、WAW（网站分析星期三）——沙龙活动平台、Internet CDO——行业资讯及共享发布平台。

【推荐收藏】8种推荐算法对比详解

DigiMax Global · 公众号 · 大数据 · 2021-04-20 08:00

正文

请到「今天看啥」查看全文

简单来说就是基于用户的一些基础特征，比如性别，地区，年龄等静态属性。给用户打上标签，针对用户的标签推荐相应的一些内容。

优点：

基于用户静态属性的推荐，优点是不存在冷启动问题，就算没有新用户的历史行为数据，也可以按用户的静态属性标签推荐相应的内容，而不会过多依赖新用户的行为数据。

缺点：

但是缺点也比较明显，一是精准度相对较低，有时基础特征相似的用户喜欢的内容不一定相同，因此推荐的内容就不一定是用户感兴趣的。

二是属性标签过于简单，仅包含了静态的基础特征属性，而用户的喜好是动态的，不断在发生变化，因此这种算法无法及时地推荐用户喜欢的内容。那么有没有基于动态特征的算法，推荐用户更有可能喜欢的内容呢？

下面我们要说的第三种跟第四种算法相对就更灵活、更精准，分别是基于用户相似度和基于物品相似度的两种推荐算法，它们本质上都是基于用户历史偏好数据。

基于用户相似度

首先我们来说说基于用户相似度的算法，与基于用户属性最大的区别就是，增加了用户的动态属性，需要利用到用户的历史偏好数据，而不仅是静态特征。

举个例子，在电商平台上，小明购买了钢笔和书，小红购买了钢笔、书还有笔记本，小刚则购买了球鞋。根据他们的历史购买数据可以判断小明和小红的偏好较为相似，那么就可以推断出小明也可能喜欢或者需要笔记本，因此将笔记本这类商品推荐给小明，小明对笔记本就更有可能产生偏好。

基于物品相似度

而基于物品相似度的算法同理，根据众多用户的历史行为数据，判断物品与物品的相似度，将若干个相似度高的物品推荐给用户。虽然这种算法计算的是物品相似度，但本质上依然是基于用户的历史偏好数据。

比如前两天我在京东搜索了数字营销书籍这个关键词，后来系统就给我推荐了这本《数据赋能》，其中的原理是，不少购买过数字营销相关书籍的用户，也买了这本《数据赋能》，基于用户历史数据，算法推测出《数据赋能》与那些数字营销书籍有较高的相似度，因此系统将这本书给用户进行推荐。我买了之后发现这本书确实很好，干货与案例并存，了解数字化转型必备。

优点：

可见基于历史偏好数据的这两种推荐算法，优点都是更加个性化、能够处理更复杂的场景，而不仅仅只是基于简单的性别、年龄等静态属性。

并且还能很好地支持用户发现潜在的兴趣偏好，比如我在淘宝购物时，我本来只想买件衬衫，而算法基于其他相似用户的购买数据，给我推荐其他用户买来搭配衬衫的裤子，那么我就有可能同样喜欢这样的搭配，并产生更进一步的购买行为。

缺点：

但这两种算法相应的缺点是，新用户或者新物品会遇到“冷启动”问题，比如电商平台中，用户在没有产生购买行为时，系统就无法基于用户的历史偏好数据来进行推荐。

此外这种算法推荐的质量还依赖于用户历史偏好数据的多少，数据越多准确性相对越高，因此在初期，系统推荐的质量则比较差，不够精准。

基于热度

首先介绍基于热度的推荐算法，这种算法的原理是根据内容的互动数据，计算出时下热度最高的内容并推荐给用户。计算热度的维度可以是时间、内容访问量、用户对内容的评分等维度。

比如微博热搜就是典型的基于热度推荐，在时间维度的基础上，根据内容的访问量得出实时的最热榜单。此外，一些影评类、视频类网站也会使用热榜来给用户进行推荐，比如豆瓣就会按评分得出好评榜单。