正文
针对上述背景和业务痛点,我们致力于将内容分析到指导内容生产的过程实现自动化、高效化、科学化,构建了一个基于内容细粒度分析的、可指导内容生产的
内容分析Agent。
我们的内容分析Agent包括以下模块:
-
内容特征体系生成:
面向用户的内容生产目标(如希望为淘宝搜索域生产一批优质的AIGC视频),Agent自动拆解分析维度(如画面、配乐、文案等),构建完善、清晰的内容特征分析体系。
-
内容特征细粒度标注:
结合内容的用户消费数据,提取需要分析的多模态内容,通过机器自动标注,实现准确、高效、细粒度地拆解多模态素材的多维度特征。
-
优质内容特征挖掘
:利用因果推断等统计学方法,挖掘并归因得到优质内容的细粒度特征,指导内容生产者制定分渠道、分人群、分商品类目的内容生产策略。
▐
内容特征体系生成
在多数情况下,内容生产者可能只明确内容生产的目标(如想生产一批爆款视频),但并不知道如何拆解和实现这一目标,或者无法构建一套完善、合理、清晰的标签体系。
针对以上痛点,我们设计了一个
内容特征分析体系生成Agent
。
该Agent能够基于用户的内容生产目标,自动生成维度完善、定义清晰、格式标准的内容细粒度分析体系,可实现以下效果:
-
分析体系完善化
:根据用户需求,自动生成多层级的标签树,涵盖内容的各个维度。
-
标签定义清晰化
:为每个标签提供明确的定义,确保含义易于理解。
-
体系格式标准化:生成的分析体系按照统一的格式,方便后续解析和处理。
内容特征分析体系生成Agent包括以下模块:
(
1
) Planning
利用大语言模型强大的任务拆解和规划能力,针对用户的多种输入,拆解任务,并自动路由调用工具。
用户仅输入需求描述:
用户输入了初步的分析体系:
-
判断输入内容的模态
(文本、图片)
和形式
(表格、脑图等),然后调用大语言模型或多模态模型,将用户输入的分析体系解析为统一的文本格式。
-
自动判定分析体系的维度完整性
,判断其是否足以支持分析和生产目标,如不完整,则会调用分析体系自动补全功能。具体实现方法是:依据分析需求,基于大语言模型的基础能力,结合业务样本输入,添加域外知识,自动补充相关标签,实现标签树的生成与扩展。这里举个例子,比如手淘外投业务输入了视频的分析体系和一批视频素材,系统会自动调用MLLM生成视频的Dense Caption,自动总结视频内包含的一些内容要素,作为大语言模型域外知识的补充,结合大语言模型的世界知识,生成视频分析的完整的标签体系。
-
自动定位抽象或模糊的标签
,基于大模型的世界知识,结合用户输入的样本,自动总结并清晰化标签定义。
-
自动定位选项不完整的标签
,对其进行补充,确保选项遵循MECE原则(Mutually Exclusive Collectively Exhaustive),即选项之间相互独立、完全穷尽,不重叠、不遗漏。
(
2
)
Action
Action模块内集成了一系列子能力,包括标签格式化解析、标签树自动生成与扩展、标签定义清晰化等。
(
3
)
Memory
Memory模块存储历史生成的分析体系和一些域内知识。当面对新的内容生产需求时,Agent会先在Memory中检索,查看是否有可复用的分析标签体系结果。同时,对于某些定位到的模糊标签,会先在Memory中检索是否有相关的定义,增强标签体系的专业性和准确性,提高内容分析体系生成和构建的效率。
应用效果
针对图文内容生产的需求,Agent自动生成并构建了完善的标签体系,为后续的内容分析和生产提供了有力支持。