专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
成都日报  ·  微周刊|“芒”有所获 ... ·  10 小时前  
新浪科技  ·  【#白象商标争议再升级# ... ·  23 小时前  
新浪科技  ·  【#韦东奕一天涨粉1000万#】“韦神”韦东 ... ·  22 小时前  
雷科技  ·  USB-C,太乱了!!! ·  2 天前  
新浪科技  ·  #苹果称超90%交易额归开发者#【苹果:#A ... ·  2 天前  
51好读  ›  专栏  ›  腾讯研究院

万字长文,聊聊下一代AI Agent的新范式

腾讯研究院  · 公众号  · 科技媒体  · 2025-03-25 17:00

主要观点总结

中国企业发布了全球首款通用型AI Agent——Manus AI,引起了科技界的广泛关注。Manus不仅能生成文本或提供建议,还能独立思考、规划并执行复杂的任务。在英伟达的GTC年度技术大会上,Agentic AI被认为是人工智能技术演进的关键阶段。Manus的发布和探索下一代Agent新范式得到了腾讯研究院和腾讯学堂的支持。洪思睿、余一和揭光发等专家在圆桌讨论中分享了关于Manus的技术创新、未来AI Agent的发展以及AI时代就业改变的看法。他们讨论了Manus的实测效果、AI Agent展现能力的场景、技术瓶颈、未来趋势以及应对AI时代就业改变的策略。

关键观点总结

关键观点1: Manus AI的特性与功能

Manus AI是首个通用型AI Agent,不仅限于生成文本或建议,还能独立思考、规划并执行复杂任务,为用户提供从指令到结果的一站式服务。

关键观点2: Agentic AI的定义与重要性

Agentic AI是人工智能技术演进的关键阶段,从单次响应升级到具备自主推理能力的智能体。

关键观点3: 技术创新与未来趋势

Manus的技术创新主要体现在其产品体验上,让用户能清晰看到AI完成任务的每一步。未来Agent技术将包括自我评估能力、跨环境能力、自主学习和进化等。

关键观点4: 应对AI时代就业改变的策略

使用增量思维看待AI的发展,认识到新的行业和工作机会会随之诞生。AI领导力将成为关键,需要持续学习和适应,找到自己在AI时代的价值定位。


正文

请到「今天看啥」查看全文


但这次用Manus的体验完全不一样。可能是因为现在用户还不多,整个产品用起来特别流畅。让我特别惊喜的是,它只用了17分钟就帮我完成了一份很完整的行业分析报告。这份报告包括了:行业现状分析、发展趋势预测、重要公司筛选以及每个公司的详细信息。我还试用了它的其他功能,比如制作网页、开发小程序,还有在小红书上发图片。整个体验都很顺畅,特别是那份17分钟就完成的分析报告,真的让我感到惊喜。
虽然市场上对这个产品有不同看法和争议,我在朋友圈称之为"Agent的DeepSeek时刻"。我之所以这样评价,是因为它的产品设计确实出色。它会展示详细的任务清单,让用户清楚看到它如何规划和分解工作。与以往的AI不同,这个产品不需要太多预设就能智能地处理问题。它能同时处理多个任务,一步步完成并最终交付完整结果,整个过程非常流畅。
这让我想到其他AI产品的发展历程。我早期使用过O1,但它不展示思考过程。后来的DeepSeek R1虽然可以看到思考过程,但效果不够理想。不过,R1的思考方式已经让我印象深刻。
这款新产品通过展示所有步骤和任务清单,让用户能看到完整的工作过程。在数据分析、总结和营销策略制定等方面,它的表现堪比一个优秀的实习生。但在编程方面还需改进——比如编写贪吃蛇游戏或开发小程序时,效果不如Claude 3.7。最近市面上也出现了其他类似的AI开发助手。
总的来说,这是一款对普通用户非常友好的产品。使用后,你就能真正理解什么是AI助手——它就像一个能够自主规划、分解任务并执行的智能助理。这是一个完整但并非完美的产品,它仍受限于自身的技术和AI模型能力,正在不断进步和完善中。
徐思彦:
现在对于Agent还没有统一的定义,你们是如何定义 Agent的,manus 的这个产品设计符合对Agent 演化的预想吗?
揭光发:
关于Agent的定义,我们可以这样理解:与传统的语言模型 (LLM) 纯文本生成或聊天模式不同,Agent是一个能够自主思考、规划,并使用工具来完成用户任务的系统。它能形成一个完整的任务闭环,不只是针对问题生成简单回应就结束。传统的聊天机器人可能只会打个招呼或写个故事,但真正的Agent能够理解用户需求,进行网络搜索、生成文件、编写代码,最终将完整的成果交付给用户。
在过去两年,业界对Agent这个术语的使用较为混乱,有些从业者甚至把简单的语言模型文本生成也称作Agent。因此,我们需要厘清Agent的概念:现在所说的Agent应该是能够完成具体任务的系统,就像一个实习生能够完成交办的任务那样,而不是仅仅通过对话给出简单的反馈。
从使用语言模型到现在,这个领域经历了相当长的发展。以代码生成为例,Manus的产品形态借鉴了至少两三个技术产品。其中之一是Devin,这是由一个华人团队开发的产品。Manus借鉴了Devin在浏览器中可视化展示代码编写过程的创新。此外,Manus还采用了其他产品的常见做法,比如制定计划和任务清单,这在GPT Pilot等代码协作工具中很常见。它的运作方式模仿真实开发团队,将大任务分解成小任务。
GPT Pilot建立了任务数据库,让AI"工程师"可以认领并完成编码测试任务。所以,Manus的设计并非完全原创,而是整合了其他产品的优秀功能,这也是为什么有人说它是"拼凑"不同技术的产品。
不过,Manus确实巧妙地整合了这些优秀功能,给普通用户带来惊喜。作为业内人士,我认为Manus最大的成功在于产品体验方面:它让用户能清晰地看到AI完成任务的每一步,并实时了解进展。这种体验设计确实出色。但从技术层面来说,它使用的都是近两年比较常见的技术,没有太多突破。关于AI助手的未来发展,我们稍后再讨论。
徐思彦:
Manus给自己的一个定义就是业界“第一个通用Agent”,那这到底是一个概念的炒作呢,还是事实上它具备了一定程度的通用能力呢?
揭光发:
我觉得他们在做营销概念方面很擅长。实际上,这种Agent的基本框架并不复杂——现在的程序员用现成的开源框架,一天就能做出一个类似的Agent。
关于它是否真的"通用",主要要看它能用什么工具。比如在代码生成领域,像Cursor这样的工具,它就专注于写代码、读写文件、查询网络信息等编程相关的功能。
Manus确实内置了29个工具,这一点已经被网上的人分析出来了。这些工具能够完成日常工作中的很多基本任务,比如写作、收集信息、分析数据、写代码和浏览网页等。
正是因为它的工具覆盖面比较广,所以它才说自己是"通用"Agent。但这并不意味着它真的什么都能做。比如让它去炒股或者处理一些专业领域的特殊任务,它就做不了。
所以准确地说,它只是一个功能相对丰富的基础智能助手,而不是真正意义上的通用Agent。这更多是一个营销手法,显示出这个团队在市场推广方面很有能力。
徐思彦:
如果说DeepSeek 相较之前大模型的改进在于通过结合大模型与专家模型来节省资源。那么对于Agent来说,专注细分领域和“通用型”Agent,哪种路径更易落地?
揭光发:
在Agent技术层面,其实就像基础素质教育一样,大家都需要有基本能力。但像人类社会一样,Agent也需要有分工和专业化,根据不同场景提供不同的解决方案。
这是一个可行的发展路径。因为完全通用的Agent在实际应用中反而有局限性,专业深度不如垂直领域的Agent。比如用Claude 3.7做代码生成,画SVG的质量就比写代码好得多。这是因为在垂直领域投入了更多优化,而通用Agent难以在每个领域都做到这么深。
徐思彦:
请余一跟我们分享一下,你觉得AI Agent正在怎么样重塑你的工作流?
余一:
现在的AI系统底层能力很强,集成了很多工具,可以在多个领域都发挥作用。我自己最近也在深入使用这些AI工具。这些AI助手真的很灵活,既能处理日常工作,也能应对专业任务。比如在做调研时,它既可以处理一般性的资料收集,也能提供专业领域的分析。
我觉得,如果一个AI只是简单加入了某个行业的专业知识,这样还不够。反而是通用型AI可能更有优势,因为它技术更全面,基础能力更强,而且使用起来更省钱。这种通用AI很可能会替代一些基础的专业AI。
我在探索它在工作和生活中的作用,看看它有什么优点和不足。虽然还没有完全改变我的工作方式,但像Claude、GPT-4 Pro这些AI工具已经成为我工作中重要的帮手。最大的变化是在搜索方面,现在我不用事事亲力亲为,只要把任务交给AI,定期检查结果就行。而且它会及时反馈进度。
给我最大的感动就是属于说“不用给 AI 配一个人”,但我也在测到底有多少个任务是可以把我从这里面重度解脱出来,或者是我可能只需要在一定的阶段里面去做一下 check 和和指指明方向的任务。

Part II 技术理解

徐思彦:
我们刚才讨论了应用和产品创新方面的理解。第二部分,让我们探讨一下Manus的技术层面。Manus的AI核心技术是在过去两年各项技术基础上的一个整合。那么它与OpenAI的Deep Research、Devin这些产品相比,具体有哪些异同呢?
揭光发:
好,让我来解释一下目前的技术发展情况。Manus的工作原理和流程图现在网上都能看到。说实话,Manus在核心技术上并没有太大突破,主要的技术创新反而出现在Deep ReSearch这类产品上。
Manus采用了多个AI助手 (Agent) 协同工作的方式。它包括计划制定、总结和审查等功能,这些功能都需要多次调用大语言模型。有人把这叫做"多Agent系统",但实际上更像是一个固定的工作流程。






请到「今天看啥」查看全文