正文
言外之意就是,这是AI思维模式、发展路径的一次重大改变,预示着未来AI发展的全新路径。
过去的GPT系列模型虽精确且量大,但缺乏“思考”环节,因此难以真正理解复杂学科如物理学和数学。
这一次的具体变化归结为“思维链” (Chain-of-Thought, CoT)一词。o1 系列模型采用全新的训练方法,不再局限于模仿训练数据中的模式,而是通过强化学习和“思维链”技术,引导模型自主解决问题,主打推理能力。工作原理本质上是-思维链的自动化,把一个复杂问题拆解成若干简单步骤,从而有利于大模型解决复杂的逻辑问题。
OpenAI 创始人山姆·奥特曼(Sam Altman) 将 o1 称为“迄今为止最强大、最一致的一系列模型”,并将其视为迈向自主系统或代理的关键一步。
总结起来,“思维链”有几个特性:像人一样思考,自主推理,自动分解步骤,通过一系列模型协同完成。
有没有觉得“似曾相识”?没错,早在7月底的ISC.AI 2024大会上,360集团创始人周鸿祎就提出:“用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力。”
他认为,快思考的特点是快速直觉、无意识,反应很快但能力不够强。GPT类大模型通过训练大量知识,主要学习的是快思考能力,GPT这类大模型可以做到脱口而出,但是质量不够稳定,甚至会“一本正经地胡说八道”,所答非所问。而慢思考则是缓慢、有意识、有逻辑性,需要分很多步骤,类似写一篇复杂的文章,要先列提纲,根据提纲去搜集数据,收集素材,根据素材进行讨论,再把文章写出来,还要进行润色和修改。也就是说,慢思考更像真正的人类一样去思考,先了解问题的意图,再对分步完成一项复杂的任务。
周鸿祎评价:“这一次OpenAI o1拥有了人类慢思考的特质,在回答问题前会反复地思考,拆解、理解、推理,可能会自己问自己1000遍,然后才能给出最终的答案。”
显然,“思维链”与“慢思考”是一套逻辑体系,不谋而合,只是周鸿祎无论从观点到实践,都早了近两个月。
这也将是产业的一个转折点。GPT当年很轰动,并引发了千模大战。但是卷大模型的道路上,普遍缺乏“思考”环节,有时不能正确理解问题,有时不能解答复杂的科学问题。
随着“思维链”与“慢思考”的提出,为AI的发展引入了新的底层思维逻辑,不仅在生成内容时进行计算,还模拟了“先想后说”的过程,更接近人类思维模式,标志着向通用人工智能(AGI)迈进的重要一步。
正如周鸿祎所说:“所以,以后比的不是多快能给你答案,而是给的答案完不完整,人工智能到最后还是要参考人类大脑的组成来构造工作模式。”
多模型协同:搭台子、建班子、练队伍
与过去一味地卷大模型不同,周鸿祎更关注的是如何让AI真正解决问题,真正给用户带来价值。两个月前,周鸿祎在提出“慢思考”的全新逻辑时,也拿了出全新的解题思路----多模型协同。
如何通过多模型协同来实现人类的思维模式呢?
以前MoE(Mixture-of-Experts,混合专家)架构的稀疏混合专家模型都被认为是Transformer之后大模型下一个发展趋势。MoE模型可以只选择某一专家模型来处理数据,这使得模型在推理过程中更为高效,因为大部分专家处于未激活状态,从而减少了不必要的计算,即所谓的快思考。而在7月底的ISC大会上,360推出了CoE(Collaboration-of-Experts,专家协同)技术架构,可以让多个模型分工协作、并行作战,执行多步推理,不同模型之间可以相互补充、相互校验,确保面对复杂问题可以有更稳定的输出,解决“AI幻觉”的弊端。可以预见,未来CoE会替代MoE成为新趋势,开启多模型协同时代。