专栏名称: 阿里研究院

阿里研究院依托阿里巴巴集团海量数据、深耕小企业前沿案例、集结全球商业智慧，以开放、合作、共建、共享的方式打造具影响力的新商业知识平台。阿里研究，洞察数据，共创新知！官方网站http://www.aliresearch.com/

治理之智 | 幻觉是模型创造能力的伴生品

阿里研究院 · 公众号 · 电商 · 2025-05-01 10:50

正文

请到「今天看啥」查看全文

二、针对模型幻觉的系统性应对方案正在不断发展

从技术角度发现，不论是通用模型还是推理模型，幻觉与模型在训练策略上的选择、模型训练的参数设置和多元优化目标的选择相关。应将幻觉看成是可以优化的Feature，而不能简单将其视为Bug，才能更好控制有害幻觉，增加有益泛化。目前产业界已经出现了基于模型能力的内生性调优、基于外层护栏的补充保障能力、以及基于应用侧按需调用适配模型的三方面系统性方案。

（一）供给侧：基于模型能力的内生性调优

在后训练阶段，通用模型利用安全微调和安全对齐进行内生性调优 。比如通过SFT引入标准问答对，使模型更好地在对齐人类意图、激活泛化能力的同时，提高生成内容的准确性和可靠性。还可以通过基于人类反馈的强化学习(RLHF)，让人类对模型的输出进行排序，使模型学习到哪些输出是更准确、更符合人类价值观的。[5]

推理模型的后训练也逐渐出现了兼顾创造力与准确性的方案。其一，模型可以基于用户的意图理解，判断给出事实性还是创造性的回答 。比如，通过系统提示词(System Prompt)的方式决定模型是否开启深度思考模式。System Prompt是由系统或开发者预先设定的一段提示词，对用户通常不可见，会根据用户的输入内容在后台引导模型的行为和输出风格。模型在现实中的应用，有些是偏数学和代码类的，需要依靠模型推理能力深度思考；而有些更偏事实性的先验知识，此类任务启用推理模式容易“用力过猛”，更适合模型结合训练知识以及RAG语料直接给出回答。例如最新推出的通义系列开源模型Qwen3.0，当用户通过百炼平台调用时，System Prompt可以结合模型指令遵循的能力，根据用户输入的关键词判断什么时候需要慢思考"Think"，什么时候需要快思考"Talk"，兼顾模型结果的创造性和严谨性。同时，当对模型进行本地化部署时，Qwen3也支持用户通过简单指令或配置文件让模型在思考与非思考模式之间动态切换。

其二，RL自身的技术路线也在不断演进，通过算法优化平衡创造性与幻觉控制 。R1的RL过程采用的是GPRO方法，允许模型在较大范围内调整策略以增强创造性，但也可能因过度探索引发幻觉。在此基础上诞生的DAPO优化，通过 引入动态奖励机制，在奖励函数中加入事实验证模块 ，对生成内容进行实时校验，可以抑制无依据的联想。[6] 而在今年4月刚出现的VAPO方法，又在DAPO基础上 集成知识图谱检索等外部验证机制，让模型在生成关键信息时引用可信来源 ，采用“生成-验证-修正”的循环，保障创造性输出不偏离事实框架。[7]

其三，对不同任务类型进行精细化训练，调整SFT语料的占比 。针对摘要、改写、翻译、报道等需要在忠于原始内容之上进行少量再创造的场景，可以加强约束（增加更多相关的SFT语料等），让模型在更多需要忠实原文的任务中，通过对更多微调语料规则的学习，与人类意图对齐，减少幻觉生成。[8]

（二）供给侧：基于外层护栏的补充保障

一方面， 对于专业领域的知识，通过外挂知识库的方式帮助模型正确使用 。例如检索增强（RAG）能够在不改变模型通用能力的前提下，在模型应用阶段引入外部知识，提升语料的时效性和专业性，解决模型训练数据无法及时更新的问题，增强大模型生成内容对具体场景的适配度。另一方面， 通过外围护栏和安全巡检，控制模型生成幻觉内容 。依靠外层护栏能力，包括关键词拦截、标准问答等技术持续监控模型。在采取以上措施的基础上，由于模型概率的不可控性，为进一步缓解幻觉的发生，依然会对模型生成内容采取自动化的实时安全巡检，在输出前再执行一次安全过滤和及时拦截。

（三）需求侧：基于应用按需调用适配模型

在工程上，可以利用Agent能力根据任务的复杂度，调用不同模型和工具进行处理，实现高效协同 。通过对用户需求更深度理解，Agent可以通过路由模块对任务复杂度进行分类，将基础问答、数据查询等简单任务交给基座模型快速响应，或调用工具直接完成；而对需要“慢思考”的多步骤推理、代码生成等复杂任务则交给推理模型完成。这样既可以避免算力资源浪费，又能提升任务的成功率。