专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
51好读  ›  专栏  ›  DeepTech深科技

研究人员构建欲求驱动智能体,可用于模拟人类日常活动

DeepTech深科技  · 公众号  · 科技媒体  · 2025-04-26 18:01

正文

请到「今天看啥」查看全文


图 | 对比不同的智能体动作生成机制(最右侧为所提出的欲求驱动的自主机制)(来源:资料图)

研究中,该团队构建了欲求驱动智能体 D2A(Desire-driven Autonomous Agent),它主要包含价值系统(Value System)以及欲求驱动规划器(Desire-driven Planner)两个部分。

价值系统负责维护预定义的一系列欲求维度的变化,模拟人类多元欲求的动态变化机制(比如随着时间饥饿感会增加),在行动前将欲求满足的感官状态以文本描述的方式呈现给智能体,并在智能体行动得到环境反馈后进行对应更新。

而欲求驱动规划器用了一种符合人类直觉的动作扩展方法,首先想象了多种可行的活动,之后模拟采取这些行动后各维度欲求价值的变化情况,之后根据以上想象的结果选择能最好满足当前欲求的活动作为当前步骤的行动。

(来源:资料图)

研究团队发现这种自主智能体框架生成的动作序列,相较于给出明确目标和角色档案,或者基于显式思考或优先级排序的智能体范式(LLMob、ReAct 和 BabyAGI),能够生成更像人类自然的活动序列(更加类人)。

同时,研究团队通过定量分析发现 D2A 生成的动作序列能有效地降低各欲求维度的不满足程度(更加理性),表现出和人类驱动模式较高的一致性。研究团队也将 D2A 扩展到多智能体环境中进行实验,发现其能生成相比基线方法更丰富自然的活动序列。

审稿人认为,本次研究提出了一种新颖的动态欲求驱动框架,用于模拟人类的日常活动以及人类的动机系统。研究团队通过将需求理论转化为可计算模型,使用内在的价值系统代替了传统大模型 agent 的外在任务系统,使智能体能够更加灵活地生成类人的活动序列。通过无需预设指令的主动行为生成(Proactive Action),相比 ReAct/BabyAGI/LLMob 等基线方法,研究团队的智能体在行为拟真度与多样性上展现优势。

与此同时,审稿人还认为本次研究提供了灵活的框架,让用户能够自己设计特定的价值维度,从而适应不同领域的研究。

视频|户外场景活动模拟示例(来源: 钟方威)

最后,审稿人指出,本次研究也针对不同场景(包括室内和室外场景),人物设定以及 baseline 进行实验。最终通过清晰的结果展示,论证了框架的有效性。研究团队通过热力图和不满足度的折线图,清晰地展示了欲求价值-行为关系以及实验结果对比基线模型的胜率。

总的来说,本次研究为智能体提供了一种全新的自我驱动方法,基于自己的价值维度进行不同活动。研究团队认为这个框架在不远的将来,有望能够应用于大型社会模拟器(例如构造多个不同欲求和个性的类人智能体,从而模拟一场社会实验,将有望改变社会科学领域的研究范式)、社交机器人(通过自身的“社会连接感”以及其他价值维度需求主动与用户互动,或是模拟用户当前的状态提供个性化服务)等等。

除此之外,研究团队也认为这个方向的研究能够应用在互动游戏的非玩家控制角色(NPC,Non - Player Character)中,帮助 NPC 自我驱动的生成类人交互行为。这种技术可以让 NPC 表现出更自然、动态和个性化的行为,从而增强游戏的沉浸感和可玩性。







请到「今天看啥」查看全文