专栏名称: 大数据与机器学习文摘
分享大数据技术相关文章和资源
目录
相关文章推荐
人工智能与大数据技术  ·  本地部署 DeepSeek ... ·  3 天前  
数据派THU  ·  首个大模型全链路安全综述 ... ·  3 天前  
数据派THU  ·  【ICML2025】一图胜千言:一种可用性可 ... ·  3 天前  
InfoTech  ·  突发!DeepSeek更新了 ·  4 天前  
51好读  ›  专栏  ›  大数据与机器学习文摘

Quora 是如何使用机器学习的?

大数据与机器学习文摘  · 公众号  · 大数据  · 2017-05-15 17:27

正文

请到「今天看啥」查看全文



在Quora, 还有很多其他的排名应用,有些甚至不为人察觉。例如,对于一个答案点zan的用户名也是排序后显示的,目的是要将我们认为对于该问题/答案最有见识的用户排在最前。同样,对于特定问题显示可能的回答者时,那些推荐的用户也是排过序的。


让我们来仔细看看机器学习排名算法的两个特例:搜索以及个性化排名。


搜索算法


对于Quora这样的应用,搜索算法可以被视为排名的另一个应用。实际上,搜索可以分解为两个步骤:文字匹配和排名。第一步,以某种方式返回与搜索框输入的查询字符串匹配的文档(问题)。然后,这些文档作为第二步的候选问题,进行排名,以使点击概率等方面得到优化。


第二步中很多的特征可以使用,它确实是另一个机器学习排名算法的例子。包括已在最初文字匹配阶段使用过的简单文字特征,以及其它与用户行为相关的特征,或是如流行度等对象属性。


个性化排名


在如上文描述的一些场景中,也许一个对所有用户的全局最优排名就够用了。换句话说,我们可以假定,对于给定问题,最“有帮助”答案的排序对于阅读答案的用户来说是独立的。然而,这一假设在很多重要场合并不成立。场合之一就是Quora Feed,从根本上说它是任意登入这一产品的用户都可见的主页。在这个主页上,我们试图为特定的用户在特定的时间挑选最“有趣”的故事,并进行排名(见下例)。这就是一个典型的机器学习个性化排名,与Netflix主页对电影和电视剧进行排名类似。



而Quora的用例比Netflix电影电视剧排名更具挑战性。事实上,我们的用例可以看作是Netflix、Facebook以及Google News优化个性化排名的结合体。一方面,我们要保证排名靠前的故事在主题上与用户相关。另一方面,Quora与用户之间也有明确的关系。你在“社交网络”上的行为也应当对排名有所影响。再次,Quora上的故事有时或许与正在进行的潮流事件相关联。及时性是另一个应当影响模型决策的因素,来决定一个故事的排名应当提升还是降低。







请到「今天看啥」查看全文