资源 | 主要推荐系统算法总结及Youtube深度学习推荐算法实例概括

机器之心 · 公众号 · AI · 2017-07-09 12:23

正文

协同过滤（CF）有两种基本方法，它们分别是：基于用户的协同过滤技术和基于项目的协同过滤技术。

该推荐算法的以上情形中均包含两步：

1. 找到数据库中有多少用户/项目与目标用户/项目相似。

2. 在给定与某产品用户/项目更相似的用户/项目的总权重时，评估其它用户/项目，来预测你给用户的相关产品的评分。

在该算法中，「最为相似」意味着什么？

我们拥有的是每一位用户的偏好向量（矩阵 R 的列），以及每一个产品的用户评分的向量（矩阵 R 的行）。

首先，只留下两个向量中值都已知的元素。

举个例子，如果我们想比较 Bill 和 Jane，我们知道的信息是 Bill 没有看过泰坦尼克号，Jane 没有看过蝙蝠侠，那么我们只能通过星战来衡量他们的相似度。怎么可能会有人不看星战，对吧？（微笑）

最流行的测量相似度的方法，是测量用户/项目向量的余弦相似度（cosine similarity）或相关度（correlations）。最后一步是根据相似程度，采取加权算术平均方法，填满表中的空单元格。

用于推荐的矩阵分解

另一个有趣的方法是使用矩阵分解。这是一种优雅的推荐算法，因为通常在矩阵分解时，我们不会过多考虑结果矩阵的行列中哪些项（item）会被保留。但使用该推荐工具时，我们可以清楚地看到 u 是关于第 i 个用户的兴趣的向量，而 v 是关于第 j 部电影的参数的向量。

于是我们能够通过 u 和 v 的点积来估计 x（第 i 个用户对第 j 部电影的评分）。我们用已知的评分建立这些向量并以此预测未知的评分。

举个例子，矩阵分解后我们获得了 Ted 的向量（1.4；.9）和电影 A 的向量（1.4; .8），现在我们可以仅仅通过计算（1.4； .9）和（1.4； .8）的点积来还原电影 A-Ted 的评分，评分结果为 2.68。

推荐文章

爱可可-爱生活 · 【[348星]tldx：快速查找可用域名的高效工具。亮点：1. -20250602214534

14 小时前

爱可可-爱生活 · 【[31星]Chatterbox-TTS-Server：自建高性-20250602215637

13 小时前

新机器视觉 · 光学系统常用光学参数的测量

13 小时前

爱可可-爱生活 · 早！ #早安# -20250602053641

昨天

Dance with GenAI · AI数据中心的光子集成芯片（PICs）发展路线图

昨天

科技每日推送 · 问答 | 更新到iOS10后，App无法上网，如何解决？

8 年前

创业邦 · 在咖啡馆路演获蔡文胜投资，与万达等40多家地产合作超140项目！

8 年前

高分子科学前沿 · 【招聘】回家吧，有奔头！辽宁恒星精细化工虚位以待（研发，高分子合成，销售，国贸等岗位）

8 年前

同道大叔 · 白羊座不得不看的人生成绩报告！

8 年前

谷歌开发者 · 马上报名 | 全新Play管理中心重点使用秘诀

7 年前