专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
相关文章推荐
新浪科技  ·  【科技+消费双主线 ... ·  14 小时前  
51好读  ›  专栏  ›  智东西

Agent综述论文火了,10大技术路径一文看尽

智东西  · 公众号  · 科技媒体  · 2025-05-29 10:28

主要观点总结

文章主要讨论了智能体的研究现状和发展趋势,重点介绍了AI Agents和Agentic AI的定义、特点、应用场景以及存在的问题和解决方案。文章指出,AI Agents和Agentic AI虽然在很多领域已经得到了广泛应用,但仍存在一些问题和挑战,需要继续研究和探索。未来,AI Agents将朝着更加自主化、智能化的方向发展,而Agentic AI则将成为下一代AI基础设施。

关键观点总结

关键观点1: AI Agents和Agentic AI的定义和特点

AI Agents是指在限定数字环境中自主感知、理解输入、并基于目标执行任务的软件实体,常用于信息检索、客服自动化、日程管理等实际场景。Agentic AI则由多个协作智能体组成,具备更强大的复杂任务拆解、自主决策和多步骤协同能力,更接近人类的组织式智能。

关键观点2: AI Agents和Agentic AI的应用场景

AI Agents广泛应用于客服自动化、企业内部搜索、电子邮件分类与优先级管理、内容推荐以及日程安排等场景。而Agentic AI则具备更高层次的认知和任务协作能力,目前的应用包括科研助手、多机器人协调系统、医疗辅助诊断系统、网络安全风险处理系统等。

关键观点3: AI Agents和Agentic AI存在的问题和挑战

AI Agents存在因果推理能力差、幻觉较多、推理深度较浅、知识更新滞后等问题,缺乏自主目标设定能力、反思能力、上下文记忆、持久性控制等。而Agentic AI面临的挑战则更多出现在智能体的协作环节,包括智能体间的错误传播、系统稳定性差等问题。

关键观点4: 解决AI Agents和Agentic AI问题的解决方案

文章总结了解决这些问题的10大解决方案,包括检索增强生成、工具增强的推理、Agent行为循环、记忆架构升级等。

关键观点5: AI Agents和Agentic AI的未来发展趋势

未来,AI Agents将朝着更加自主化、智能化的方向演进,具备主动智能(Proactive Intelligence)。而Agentic AI则将推动多智能体扩展和统一编排,解决更宏大的挑战。


正文

请到「今天看啥」查看全文


:能够对用户指令或环境状态作出动态响应,有些系统甚至能通过反馈机制逐步优化行为。
现代AI Agents的核心通常是大语言模型(LLM)和大图像模型(LIM)。 其中,大语言模型主要支持AI Agents的自然语言理解、推理、计划和响应生成,是AI Agents“思考”的基础。诸如CLIP和BLIP-2等大图像模型使AI Agents具备视觉感知能力,广泛应用于机器人、自动驾驶、内容审核等场景。
这些模型通常通过API调用方式接入,使得开发者无需从零训练模型即可构建AI Agents。
文章中用农业无人机的案例展现了AI Agents 感知、推理与行动三位一体的运作方式 。AI Agents可通过图像识别功能识别果园中的病果或坏枝,并在无人干预的情况下触发报警或处理机制。
虽然生成式AI模型为现代AI Agents奠定了技术基础,但其仍然存在重要局限,例如主动性或目标意识差、无持续记忆与状态更新能力、无法直接与外部系统交互等。
为弥补生成式AI的不足,AI Agents引入了工具调用(Tool-Use)、函数执行、上下文记忆、任务规划等模块,演化成具备初步“认知结构”的系统,例如AutoGPT、LangChain等。这标志着系统架构 从“内容生成”过渡到“任务执行” ,是Agentic AI发展的基础步骤。
如今的AI Agents通常由四个主要子系统构成: 感知、推理、行动和学习 。感知模块负责接收来自用户(如自然语言提示词)或外部系统(如API、文件上传、传感器数据流)的输入信号,并将其预处理为智能体推理模块可以理解的格式。知识表征与推理(KRR)模块是智能的核心模块,负责对输入数据应用符号、统计或混合逻辑进行处理。
行动选择与执行模块将推理得出的决策转换为外部行动,如发送信息、更新数据库、调用API或生成结构化输出。AI Agents还具备基础的学习与适应能力,如启发式参数调整或基于历史的上下文保留。

AI Agents的定制化通常通过领域特定的提示工程、规则注入或工作流模板实现,它与硬编码的自动化脚本的区别在于有上下文感知的决策能力。以ReAct系统为例,其采用推理与行动的迭代框架,使智能体在执行前能进行内部“思考”。


02 .
AI Agent可扩展性有限,Agentic AI成下一代AI基础设施


尽管AI Agents已经在自动化特定任务方面取得了突破,但这类系统在复杂、多步骤或协作场景中的可扩展性受到限制。这些限制最终催生了更先进的范式——Agentic AI。
从定义上来看,Agentic AI系统由多个AI Agents组成,Agentic AI系统的自主性要高于单个Agent,能够 管理多步骤的复杂任务,并处理需要协作的任务 。Agentic AI还涉及多智能体之间的 信息共享 ,与AI Agents相比,能够在更广泛的任务和环境中进行学习和适应。

Agentic AI系统继承了AI Agents的模块化结构,但在此基础上引入了分布式智能、智能体间通信和递归规划等增强能力。文献中总结了多项关键架构改进,这些改进构成了Agentic AI相较于AI Agents的本质区别:

(1) 专责智能体协作体系 (Ensemble of Specialized Agents):Agentic AI不再是单一智能体运行,而是由多个专责智能体组成,每个负责不同功能,如摘要、检索、规划等。这些智能体通过消息队列、黑板机制或共享内存等方式进行通信。例如MetaGPT采用模拟公司部门(如CEO、CTO、工程师)角色的方式构建智能体,角色模块化、可复用、职责清晰。







请到「今天看啥」查看全文