专栏名称: DigiMax Global
第一家聚焦于基于数据和大数据的互联网营销、运营、产品和管理的中立平台。旗下包括三个品牌:CWA(网站分析在中国)——知识分享平台、WAW(网站分析星期三)——沙龙活动平台、Internet CDO——行业资讯及共享发布平台。
目录
相关文章推荐
大数据文摘  ·  “程序员炸锅”!Claude一夜撤离 ... ·  2 天前  
数据派THU  ·  多模态RAG实战指南:完整Python代码实 ... ·  3 天前  
51好读  ›  专栏  ›  DigiMax Global

【推荐收藏】8种推荐算法对比详解

DigiMax Global  · 公众号  · 大数据  · 2021-04-20 08:00

正文

请到「今天看啥」查看全文



简单来说就是基于用户的一些基础特征,比如性别,地区,年龄等静态属性。给用户打上标签,针对用户的标签推荐相应的一些内容。


优点:

基于用户静态属性的推荐,优点是不存在冷启动问题,就算没有新用户的历史行为数据,也可以按用户的静态属性标签推荐相应的内容,而不会过多依赖新用户的行为数据。


缺点:

但是缺点也比较明显,一是精准度相对较低,有时基础特征相似的用户喜欢的内容不一定相同,因此推荐的内容就不一定是用户感兴趣的。


二是属性标签过于简单,仅包含了静态的基础特征属性,而用户的喜好是动态的,不断在发生变化,因此这种算法无法及时地推荐用户喜欢的内容。那么有没有基于动态特征的算法,推荐用户更有可能喜欢的内容呢?


下面我们要说的第三种跟第四种算法相对就更灵活、更精准,分别是基于用户相似度和基于物品相似度的两种推荐算法,它们本质上都是基于用户历史偏好数据。


基于用户相似度


首先我们来说说基于用户相似度的算法,与基于用户属性最大的区别就是,增加了用户的动态属性,需要利用到用户的历史偏好数据,而不仅是静态特征。


举个例子,在电商平台上,小明购买了钢笔和书,小红购买了钢笔、书还有笔记本,小刚则购买了球鞋。根据他们的历史购买数据可以判断小明和小红的偏好较为相似,那么就可以推断出小明也可能喜欢或者需要笔记本,因此将笔记本这类商品推荐给小明,小明对笔记本就更有可能产生偏好。


基于物品相似度


而基于物品相似度的算法同理,根据众多用户的历史行为数据,判断物品与物品的相似度,将若干个相似度高的物品推荐给用户。虽然这种算法计算的是物品相似度,但本质上依然是基于用户的历史偏好数据。


比如前两天我在京东搜索了数字营销书籍这个关键词,后来系统就给我推荐了这本《数据赋能》,其中的原理是,不少购买过数字营销相关书籍的用户,也买了这本《数据赋能》,基于用户历史数据,算法推测出《数据赋能》与那些数字营销书籍有较高的相似度,因此系统将这本书给用户进行推荐。我买了之后发现这本书确实很好,干货与案例并存,了解数字化转型必备。


优点:

可见基于历史偏好数据的这两种推荐算法,优点都是更加个性化、能够处理更复杂的场景,而不仅仅只是基于简单的性别、年龄等静态属性。


并且还能很好地支持用户发现潜在的兴趣偏好,比如我在淘宝购物时,我本来只想买件衬衫,而算法基于其他相似用户的购买数据,给我推荐其他用户买来搭配衬衫的裤子,那么我就有可能同样喜欢这样的搭配,并产生更进一步的购买行为。


缺点:

但这两种算法相应的缺点是,新用户或者新物品会遇到“冷启动”问题,比如电商平台中,用户在没有产生购买行为时,系统就无法基于用户的历史偏好数据来进行推荐。


此外这种算法推荐的质量还依赖于用户历史偏好数据的多少,数据越多准确性相对越高,因此在初期,系统推荐的质量则比较差,不够精准。


基于热度


首先介绍基于热度的推荐算法,这种算法的原理是根据内容的互动数据,计算出时下热度最高的内容并推荐给用户。计算热度的维度可以是时间、内容访问量、用户对内容的评分等维度。


比如微博热搜就是典型的基于热度推荐,在时间维度的基础上,根据内容的访问量得出实时的最热榜单。此外,一些影评类、视频类网站也会使用热榜来给用户进行推荐,比如豆瓣就会按评分得出好评榜单。







请到「今天看啥」查看全文