专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
爱可可-爱生活  ·  【[348星]tldx:快速查找可用域名的高 ... ·  14 小时前  
爱可可-爱生活  ·  【[31星]Chatterbox-TTS-S ... ·  13 小时前  
新机器视觉  ·  光学系统常用光学参数的测量 ·  13 小时前  
爱可可-爱生活  ·  早! #早安# -20250602053641 ·  昨天  
Dance with GenAI  ·  AI数据中心的光子集成芯片(PICs)发展路线图 ·  昨天  
51好读  ›  专栏  ›  机器之心

资源 | 主要推荐系统算法总结及Youtube深度学习推荐算法实例概括

机器之心  · 公众号  · AI  · 2017-07-09 12:23

正文

请到「今天看啥」查看全文



协同过滤(CF)有两种基本方法,它们分别是:基于用户的协同过滤技术和基于项目的协同过滤技术。


该推荐算法的以上情形中均包含两步:


1. 找到数据库中有多少用户/项目与目标用户/项目相似。

2. 在给定与某产品用户/项目更相似的用户/项目的总权重时,评估其它用户/项目,来预测你给用户的相关产品的评分。


在该算法中,「最为相似」意味着什么?


我们拥有的是每一位用户的偏好向量(矩阵 R 的列),以及每一个产品的用户评分的向量(矩阵 R 的行)。



首先,只留下两个向量中值都已知的元素。


举个例子,如果我们想比较 Bill 和 Jane,我们知道的信息是 Bill 没有看过泰坦尼克号,Jane 没有看过蝙蝠侠,那么我们只能通过星战来衡量他们的相似度。怎么可能会有人不看星战,对吧?(微笑)


最流行的测量相似度的方法,是测量用户/项目向量的余弦相似度(cosine similarity)或相关度(correlations)。最后一步是根据相似程度,采取加权算术平均方法,填满表中的空单元格。


用于推荐的矩阵分解


另一个有趣的方法是使用矩阵分解。这是一种优雅的推荐算法,因为通常在矩阵分解时,我们不会过多考虑结果矩阵的行列中哪些项(item)会被保留。但使用该推荐工具时,我们可以清楚地看到 u 是关于第 i 个用户的兴趣的向量,而 v 是关于第 j 部电影的参数的向量。

于是我们能够通过 u 和 v 的点积来估计 x(第 i 个用户对第 j 部电影的评分)。我们用已知的评分建立这些向量并以此预测未知的评分。


举个例子,矩阵分解后我们获得了 Ted 的向量(1.4;.9)和电影 A 的向量(1.4; .8),现在我们可以仅仅通过计算(1.4; .9)和(1.4; .8)的点积来还原电影 A-Ted 的评分,评分结果为 2.68。








请到「今天看啥」查看全文