主要观点总结
本文主要介绍了小红书推荐系统的实践和应用,包括其推荐流程、技术挑战和解决方案,以及如何利用大模型进行内容理解和用户兴趣推理。文章强调了小红书作为一个内容分享平台的特性,如何通过推荐系统精准地将优质内容推送给用户,并介绍了系统在内容理解、新笔记冷启动、互动目标建模与优化、社区氛围利用以及用户兴趣推理等方面的技术和策略。
关键观点总结
关键观点1: 小红书作为内容分享平台,其推荐系统的核心任务是精准将优质内容推送给用户。
小红书的推荐系统通过多轮筛选和排序,确保用户能够看到最符合自己需求的内容。系统利用多种技术如多模态内容理解技术、多目标建模和强化学习等,理解用户兴趣和内容质量,从而提供精准推荐。
关键观点2: 新笔记冷启动的挑战及解决方案。
新笔记发布时缺乏用户行为数据,推荐系统通过多模态理解技术提取笔记标签、话题等信息,生成内容表征。然后通过种子人群圈选、Lookalike扩散等方式扩大新笔记的触达范围。在分发过程中,系统基于用户行为反馈实时更新笔记表征,确保新笔记能快速适应用户需求。
关键观点3: 互动目标建模与优化的重要性及实施方式。
小红书采用超长序列建模和实时多行为序列建模,深入挖掘用户的长期和实时兴趣。同时引入实时context特征,更精准判断用户即时兴趣。利用强化学习技术优化用户的互动偏好,最大化用户在长周期内的累计互动次数。
关键观点4: 大模型在社区推荐中的应用及优势。
小红书利用大模型进行内容理解和用户兴趣推理,突破信息茧房,实现内容与用户的深度匹配。引入多模态表征能力,结合文本、图片、视频等多种模态特征,提升内容理解的准确性。全链路应用大模型技术,从召回阶段到排序阶段实现优化。同时,通过用户兴趣推理,不仅识别用户已有兴趣点,还推理出潜在兴趣,为用户推荐更多相关但不完全相同的内容。
正文
多模态内容理解技术
。基于超过10亿量级的图文和视频笔记,小红书进行了大规模的多模态预训练,支持BERT、RoBERTa、ResNet、Swin-T、ViT等多种先进架构。
通过对海量内容的深度学习和分析,小红书能够自动识别和分类每一篇笔记的核心主题和语义。这种分类方式不仅更加精准,还能实时适应内容的变化。无论是时尚穿搭、美妆教程,还是旅行攻略、美食分享,小红书都能快速理解其核心价值,并将其推送给真正感兴趣的用户。
新笔记冷启动的挑战
新笔记发布时,由于缺乏足够的用户行为数据,其行为表征学习往往不充分。这意味着推荐系统很难在第一时间精准地将新笔记推送给真正感兴趣的用户。这种“冷启动”问题,是所有内容推荐平台都必须面对的挑战。
-
新笔记发布后,小红书首先通过多模态理解技术提取笔记的标签、话题、类目等信息,并生成基于多模态的内容表征。这些信息为后续的精准分发提供了基础。
-
接下来,小红书通过话题圈选和标签圈选的方式,快速圈选出与新笔记主题相关的种子人群。这些种子人群是新笔记的首批潜在受众。
-
在种子人群的基础上,小红书利用 Lookalike 扩散技术,进一步扩大新笔记的触达范围。通过分析种子人群的行为特征,系统能够找到更多具有相似兴趣的用户,从而实现更广泛的分发。
-
新笔记在分发过程中,会通过召回模型、初排模型和精排模型进行多轮筛选和排序。同时,系统会基于用户的行为反馈,实时更新笔记的向量表征,并通过 Bayesian Optimizer 自动调节提权系数,确保新笔记能够快速适应用户需求。
互动目标建模与优化:多目标预估与强化学习的结合
小红书通过
超长序列建模
,深入挖掘用户的长期兴趣历史。系统利用目标侧笔记的类目和语义信息,提取用户在过去的行为中表现出的长期兴趣点。这种建模方式能够帮助系统更好地理解用户的偏好,并在推荐中体现这些长期兴趣。
为了更精准地捕捉用户的实时兴趣变化,小红书采用了
实时多行为序列建模
。用户的行为数据会在秒级回流到系统中,系统能够快速捕捉用户兴趣的正向和负向反馈。例如,如果用户频繁点赞某一类内容,系统会加强这类内容的推荐;反之,如果用户对某些内容不感兴趣,系统会减少这类内容的曝光。
此外,小红书还引入了
实时 context 特征
,例如过去 5 分钟内用户与同类目内容的交互次数。这种实时特征能够帮助系统更精准地判断用户的即时兴趣,从而提供更符合用户当前需求的内容。
在多目标建模方面,小红书采用了