专栏名称: 懂懂笔记

我们来自知名IT和财经媒体，专注于互联网+、电子商务、大数据、万物互联和人工智能。我们关注产业动态，技术趋势和商业变革，我们与你一起，迎接这个科技转变命运的时代。

周鸿祎的 “慢思考”快了OpenAI一步

懂懂笔记 · 公众号 · 科技自媒体 · 2024-09-20 19:16

正文

请到「今天看啥」查看全文

言外之意就是，这是AI思维模式、发展路径的一次重大改变，预示着未来AI发展的全新路径。

过去的GPT系列模型虽精确且量大，但缺乏“思考”环节，因此难以真正理解复杂学科如物理学和数学。

这一次的具体变化归结为“思维链” (Chain-of-Thought, CoT)一词。o1 系列模型采用全新的训练方法，不再局限于模仿训练数据中的模式，而是通过强化学习和“思维链”技术，引导模型自主解决问题，主打推理能力。工作原理本质上是-思维链的自动化，把一个复杂问题拆解成若干简单步骤，从而有利于大模型解决复杂的逻辑问题。

OpenAI 创始人山姆·奥特曼（Sam Altman）将 o1 称为“迄今为止最强大、最一致的一系列模型”，并将其视为迈向自主系统或代理的关键一步。

总结起来，“思维链”有几个特性：像人一样思考，自主推理，自动分解步骤，通过一系列模型协同完成。

有没有觉得“似曾相识”？没错，早在7月底的ISC.AI 2024大会上，360集团创始人周鸿祎就提出：“用基于智能体的框架打造慢思考系统，从而增强大模型的慢思考能力。”

他认为，快思考的特点是快速直觉、无意识，反应很快但能力不够强。GPT类大模型通过训练大量知识，主要学习的是快思考能力，GPT这类大模型可以做到脱口而出，但是质量不够稳定，甚至会“一本正经地胡说八道”，所答非所问。而慢思考则是缓慢、有意识、有逻辑性，需要分很多步骤，类似写一篇复杂的文章，要先列提纲，根据提纲去搜集数据，收集素材，根据素材进行讨论，再把文章写出来，还要进行润色和修改。也就是说，慢思考更像真正的人类一样去思考，先了解问题的意图，再对分步完成一项复杂的任务。

周鸿祎评价：“这一次OpenAI o1拥有了人类慢思考的特质，在回答问题前会反复地思考，拆解、理解、推理，可能会自己问自己1000遍，然后才能给出最终的答案。”

显然，“思维链”与“慢思考”是一套逻辑体系，不谋而合，只是周鸿祎无论从观点到实践，都早了近两个月。

这也将是产业的一个转折点。GPT当年很轰动，并引发了千模大战。但是卷大模型的道路上，普遍缺乏“思考”环节，有时不能正确理解问题，有时不能解答复杂的科学问题。随着“思维链”与“慢思考”的提出，为AI的发展引入了新的底层思维逻辑，不仅在生成内容时进行计算，还模拟了“先想后说”的过程，更接近人类思维模式，标志着向通用人工智能（AGI）迈进的重要一步。

正如周鸿祎所说：“所以，以后比的不是多快能给你答案，而是给的答案完不完整，人工智能到最后还是要参考人类大脑的组成来构造工作模式。”

多模型协同：搭台子、建班子、练队伍

与过去一味地卷大模型不同，周鸿祎更关注的是如何让AI真正解决问题，真正给用户带来价值。两个月前，周鸿祎在提出“慢思考”的全新逻辑时，也拿了出全新的解题思路----多模型协同。

如何通过多模型协同来实现人类的思维模式呢？

首先是搭台子 —— CoE。

以前MoE（Mixture-of-Experts,混合专家）架构的稀疏混合专家模型都被认为是Transformer之后大模型下一个发展趋势。MoE模型可以只选择某一专家模型来处理数据，这使得模型在推理过程中更为高效，因为大部分专家处于未激活状态，从而减少了不必要的计算，即所谓的快思考。而在7月底的ISC大会上，360推出了CoE（Collaboration-of-Experts,专家协同）技术架构，可以让多个模型分工协作、并行作战，执行多步推理，不同模型之间可以相互补充、相互校验，确保面对复杂问题可以有更稳定的输出，解决“AI幻觉”的弊端。可以预见，未来CoE会替代MoE成为新趋势，开启多模型协同时代。