专栏名称: 大淘宝技术
淘系技术官方账号
目录
相关文章推荐
稀土掘金技术社区  ·  CSS 全新属性如何实现一个内凹圆角 ·  昨天  
码农翻身  ·  写文章赚了700多万,算不算多? ·  昨天  
腾讯技术工程  ·  重磅!鸿蒙平台首个全跨端APP ... ·  4 天前  
程序猿  ·  马云亲自回帖!万字离职贴引爆阿里内网 ·  5 天前  
51好读  ›  专栏  ›  大淘宝技术

大模型时代的内容分析Agent解决方案与业务实践

大淘宝技术  · 公众号  · 程序员  · 2025-02-28 18:40

正文

请到「今天看啥」查看全文


针对上述背景和业务痛点,我们致力于将内容分析到指导内容生产的过程实现自动化、高效化、科学化,构建了一个基于内容细粒度分析的、可指导内容生产的 内容分析Agent。



我们的内容分析Agent包括以下模块:

  1. 内容特征体系生成: 面向用户的内容生产目标(如希望为淘宝搜索域生产一批优质的AIGC视频),Agent自动拆解分析维度(如画面、配乐、文案等),构建完善、清晰的内容特征分析体系。

  2. 内容特征细粒度标注: 结合内容的用户消费数据,提取需要分析的多模态内容,通过机器自动标注,实现准确、高效、细粒度地拆解多模态素材的多维度特征。

  3. 优质内容特征挖掘 :利用因果推断等统计学方法,挖掘并归因得到优质内容的细粒度特征,指导内容生产者制定分渠道、分人群、分商品类目的内容生产策略。


内容特征体系生成


背景
在多数情况下,内容生产者可能只明确内容生产的目标(如想生产一批爆款视频),但并不知道如何拆解和实现这一目标,或者无法构建一套完善、合理、清晰的标签体系。


方案设计

针对以上痛点,我们设计了一个 内容特征分析体系生成Agent 该Agent能够基于用户的内容生产目标,自动生成维度完善、定义清晰、格式标准的内容细粒度分析体系,可实现以下效果:
  • 分析体系完善化 :根据用户需求,自动生成多层级的标签树,涵盖内容的各个维度。

  • 标签定义清晰化 :为每个标签提供明确的定义,确保含义易于理解。

  • 体系格式标准化:生成的分析体系按照统一的格式,方便后续解析和处理。


内容特征分析体系生成Agent包括以下模块:

( 1 ) Planning

利用大语言模型强大的任务拆解和规划能力,针对用户的多种输入,拆解任务,并自动路由调用工具。

用户仅输入需求描述:

  • 调用标签树生成功能,分步生成标签树。例如,用户想知道如何拆解分析爆款视频脚本的特征,Agent会先从画面、音频、文字等角度进行分析,再逐步深入探索和拆解,每个维度分别生成对应的标签树,最后汇总形成完整的标签体系。

用户输入了初步的分析体系:

  • 判断输入内容的模态 (文本、图片) 和形式 (表格、脑图等),然后调用大语言模型或多模态模型,将用户输入的分析体系解析为统一的文本格式。

  • 自动判定分析体系的维度完整性 ,判断其是否足以支持分析和生产目标,如不完整,则会调用分析体系自动补全功能。具体实现方法是:依据分析需求,基于大语言模型的基础能力,结合业务样本输入,添加域外知识,自动补充相关标签,实现标签树的生成与扩展。这里举个例子,比如手淘外投业务输入了视频的分析体系和一批视频素材,系统会自动调用MLLM生成视频的Dense Caption,自动总结视频内包含的一些内容要素,作为大语言模型域外知识的补充,结合大语言模型的世界知识,生成视频分析的完整的标签体系。

  • 自动定位抽象或模糊的标签 ,基于大模型的世界知识,结合用户输入的样本,自动总结并清晰化标签定义。

  • 自动定位选项不完整的标签 ,对其进行补充,确保选项遵循MECE原则(Mutually Exclusive Collectively Exhaustive),即选项之间相互独立、完全穷尽,不重叠、不遗漏。


( 2 ) Action

Action模块内集成了一系列子能力,包括标签格式化解析、标签树自动生成与扩展、标签定义清晰化等。



( 3 ) Memory

Memory模块存储历史生成的分析体系和一些域内知识。当面对新的内容生产需求时,Agent会先在Memory中检索,查看是否有可复用的分析标签体系结果。同时,对于某些定位到的模糊标签,会先在Memory中检索是否有相关的定义,增强标签体系的专业性和准确性,提高内容分析体系生成和构建的效率。


应用效果

针对图文内容生产的需求,Agent自动生成并构建了完善的标签体系,为后续的内容分析和生产提供了有力支持。








请到「今天看啥」查看全文