专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
51好读  ›  专栏  ›  腾讯研究院

重新理解Agent的边界与潜力|AI转型访谈录

腾讯研究院  · 公众号  · 科技媒体  · 2025-05-29 17:35

正文

请到「今天看啥」查看全文


范凌:
就拿我刚才举的西游记的例子来说,通过阅读,我们能够了解孙悟空是什么样的人。通过了解他的性格特点,我们就可以推演出他可能会做出什么样的决定、有什么样的判断,甚至能推测出他对某些事情的观点,而不仅仅是了解他掌握的知识。
徐思彦:
这个想法很有意思。不知道业界是否有其他公司也是这样定义的,现在很多人可能还是把Agent简单地看作是App的下一个发展阶段。
范凌:
大家对Agent的发展都很兴奋,特别是通过MCP实现的各种功能。虽然我们也很期待,但目前我们主要专注于用Agent进行模拟研究。至于其他公司的具体情况,我不太了解。其实在学术领域,这并不是一个全新的话题,就像Agent这个词本身也不是新概念一样。过去的模拟研究主要关注群体行为,比如元胞自动机等理论研究。这就像研究蚂蚁群落一样,观察每个个体的行为。这些研究一直在持续,最近也有很多突破性进展。比如在市场营销和信息系统 (IS) 领域,很多研究者正在探索用Agent进行市场调研。现在甚至出现了"生成式社会科学"这个新兴学科,专门用Agent来模拟社会问题。与过去主要关注群体的模拟不同,现在我们能够更深入地研究个体层面。
徐思彦:
对学术之前有论文斯坦福小镇还是比较火的。
范凌:
对斯坦福这个团队还写了一篇我像模拟100个1000个随机的美国人用Agent的。
徐思彦:
刚刚讲的都讲了底层的逻辑是怎么思考的,那可能需要一个更加具体的案例来为大家解释一下Atypica.ai是怎么样工作的。
范凌:
工作流程其实非常直观。在网页上你会看到一个对话框,和常见的AI工具一样。你可以在对话框中提出需要分析的商业问题,系统会追问三到五个问题,来明确你的具体目的。比如说,假设我想研究一个产品的用户反馈,系统会问你:"你是以什么角色来研究这个问题?你想了解性能反馈还是用户体验反馈?获得这些反馈后,你打算用于新品研发还是竞品调研?"通过这些追问,系统会更清晰地理解你的需求。
第二步,系统会把前面的问答内容整理成一系列具体的工作任务。然后第三个Agent会在社交媒体上进行实时搜索,我们主要覆盖小红书、抖音和Instagram这些平台。我们不是直接调用平台的数据接口,而是像真实的研究员一样去搜索内容。搜索后,我们能看到很多帖子,包括原文和评论。基于这些上下文,我们会模拟发帖用户的典型消费者画像,一般会生成至少5个典型用户画像,有些客户甚至会要求生成100个。
徐思彦:
Persona是一个在设计领域的专业的术语?
范凌:
Persona相当于人的原型人物画像。然后接下来会触发下一个Agent进行Interview就还问这些原型的人,相应的问题,这些问题都会和你要解决的大问题有关。问完以后把这些问答总结成Summarize成一段话。这段话再生成一个图文并茂的报告大概是这样的一个过程。
徐思彦:
产品设计上,是先从使用场景倒推出现在的产品形态,还是从模拟群体再推演出他可能的使用场景?
范凌:
让我来解释一下我们系统可以解决的四个主要商业问题:第一是市场洞察。比如,我们可以分析用户对某个产品的反馈。举个例子,我们最近研究新能源汽车市场时发现,有两个以上孩子的年轻家庭可能会需要MPV 多功能商 务车) 。第二是产品共创。我们可以邀请目标用户群体一起参与产品开发。第三是产品测试。假设你要为健身爱好者开发一款巧克力,你有A、B、C三个配方,我们可以帮你分析哪个配方最受欢迎。第四是内容规划。比如很多小红书博主会用我们的系统分析自己的账号定位,规划未来的内容方向。除了这些预期的用途,我们也发现用户在开发一些有趣的新用法。比如有人用它来规划留学,分析自己的背景并获取适合的学校建议。
最后分享一个有趣的例子:以前外国企业要了解中国市场,必须依靠中国团队做调研。现在他们只需要用Atypica用法语提问,系统就能分析中国社交媒体数据,直接生成法语报告,大大提高了效率。
徐思彦:
类似“田野调查”。
范凌:
是的。现在我们正在与一些权威媒体合作,把他们独特的数据源整合进来。这些是宏观层面的、准确的数据,不同于社交媒体上的道听途说。我们把这些严谨的数据和观点,结合社交媒体上的多元声音,形成完整的分析报告。比如说,研究中国新能源汽车如何在东南亚市场拓展这类严肃话题时,我们就在增加定量分析的比重。

Agent的创新设计带来了哪些场景新思路

徐思彦:
在最初的设想里,这项技术主要是服务于市场调研领域的用户研究。这启发我觉得这种模拟特别适合用于个人规划,因为它可以帮你探索人生中不同的可能性。现在很多时候AI在落地的时候幻觉是一个很大的问题,或者它的准确率是一个很大的问题。在你们的场景里,准确率是不是一个问题,在哪些场景会用的比较好?
范凌:
我觉得幻觉和准确率对于商业研究来说是有两面性的。商业问题既是科学又不科学,这就是为什么我前面会说它既是Science又是Art。这也是为什么我们要跟一些严肃的媒体谈合作,接入他们的数据源。虽然不是每个报告都需要接入,但对于一些特殊的问题或高阶用户来说,我们需要获取权威性的数据。这些权威数据应该优先于社交媒体上的道听途说,以确保分析的真实性。
这是Science的部分。至于Art的部分,当我们需要开拓思维时,我们需要看到更多元的视角,这时社交媒体的数据就特别有帮助。语言模型直接回答问题时会给出非常结构化的答案,但让它分析社交媒体数据时,就会发现其中存在很多争议和讨论,内容会更加丰富多样。这就是商业问题的特点,也是我们称之为复杂问题的原因。你既需要基于事实的共识,又要探索共识之外的可能性。有时候你需要看到多种非共识并存的状态,最终由人来做决策。洞察的作用不是帮你做决定,而是帮你看到更多可能性。所以我认为,这个系统在处理这种非共识的、艺术性的部分特别有优势。
某种程度上,Hallucination(幻觉)反而是件好事,因为它能让思维更开放。






请到「今天看啥」查看全文