大模型时代的内容分析Agent解决方案与业务实践

大淘宝技术 · 公众号 · 程序员 · 2025-02-28 18:40

正文

针对上述背景和业务痛点，我们致力于将内容分析到指导内容生产的过程实现自动化、高效化、科学化，构建了一个基于内容细粒度分析的、可指导内容生产的 内容分析Agent。

我们的内容分析Agent包括以下模块：

内容特征体系生成： 面向用户的内容生产目标（如希望为淘宝搜索域生产一批优质的AIGC视频），Agent自动拆解分析维度（如画面、配乐、文案等），构建完善、清晰的内容特征分析体系。
内容特征细粒度标注： 结合内容的用户消费数据，提取需要分析的多模态内容，通过机器自动标注，实现准确、高效、细粒度地拆解多模态素材的多维度特征。
优质内容特征挖掘 ：利用因果推断等统计学方法，挖掘并归因得到优质内容的细粒度特征，指导内容生产者制定分渠道、分人群、分商品类目的内容生产策略。

背景

在多数情况下，内容生产者可能只明确内容生产的目标（如想生产一批爆款视频），但并不知道如何拆解和实现这一目标，或者无法构建一套完善、合理、清晰的标签体系。

方案设计

针对以上痛点，我们设计了一个 内容特征分析体系生成Agent 。该Agent能够基于用户的内容生产目标，自动生成维度完善、定义清晰、格式标准的内容细粒度分析体系，可实现以下效果：

内容特征分析体系生成Agent包括以下模块：

( 1 ) Planning

利用大语言模型强大的任务拆解和规划能力，针对用户的多种输入，拆解任务，并自动路由调用工具。

用户仅输入需求描述：

调用标签树生成功能，分步生成标签树。例如，用户想知道如何拆解分析爆款视频脚本的特征，Agent会先从画面、音频、文字等角度进行分析，再逐步深入探索和拆解，每个维度分别生成对应的标签树，最后汇总形成完整的标签体系。

用户输入了初步的分析体系：

判断输入内容的模态 （文本、图片） 和形式 （表格、脑图等），然后调用大语言模型或多模态模型，将用户输入的分析体系解析为统一的文本格式。
自动判定分析体系的维度完整性 ，判断其是否足以支持分析和生产目标，如不完整，则会调用分析体系自动补全功能。具体实现方法是：依据分析需求，基于大语言模型的基础能力，结合业务样本输入，添加域外知识，自动补充相关标签，实现标签树的生成与扩展。这里举个例子，比如手淘外投业务输入了视频的分析体系和一批视频素材，系统会自动调用MLLM生成视频的Dense Caption，自动总结视频内包含的一些内容要素，作为大语言模型域外知识的补充，结合大语言模型的世界知识，生成视频分析的完整的标签体系。
自动定位抽象或模糊的标签 ，基于大模型的世界知识，结合用户输入的样本，自动总结并清晰化标签定义。
自动定位选项不完整的标签 ，对其进行补充，确保选项遵循MECE原则（Mutually Exclusive Collectively Exhaustive），即选项之间相互独立、完全穷尽，不重叠、不遗漏。

( 2 ) Action

Action模块内集成了一系列子能力，包括标签格式化解析、标签树自动生成与扩展、标签定义清晰化等。

( 3 ) Memory

Memory模块存储历史生成的分析体系和一些域内知识。当面对新的内容生产需求时，Agent会先在Memory中检索，查看是否有可复用的分析标签体系结果。同时，对于某些定位到的模糊标签，会先在Memory中检索是否有相关的定义，增强标签体系的专业性和准确性，提高内容分析体系生成和构建的效率。

应用效果

针对图文内容生产的需求，Agent自动生成并构建了完善的标签体系，为后续的内容分析和生产提供了有力支持。