专栏名称: 腾讯科技

只供应最有营养的科技大餐！

独家对话Manus肖弘：世界不是线性外推，做博弈中的重要变量

腾讯科技 · 公众号 · 科技媒体 · 2025-03-07 14:04

正文

请到「今天看啥」查看全文

张小珺：相当于是先在那里等着模型能力变强。

肖弘： 啊，对！

可以开源一个创业idea：你预判下一个能力是什么，先把这部分应用给好好做好。等着这个能力有了，你就…

你等到那个时候再去做，其实就晚了，对吧？

因为总有一些人，不管是他信仰这个，还是他对foundation model（基座模型）更了解，或者Cursor我就做编程领域。总有些人会去做这个产品。

这也很有意思。你看VC投资难度也变大了——因为当你看到那个产品，因为模型能力不ready，它好像不太work，一用感觉很傻；但等到模型ready，它突然就很厉害了。到那个时候它的商业化做得也比较好。

它的曲线是一个跳变。

张小珺：但是你看，现在模型能力先行，当模型发的时候原厂可能准备不足。作为一个应用公司，你可以在前面等着它，由于它模型能力变强，带来你的爆发式增长。

这个时候原厂，模型掌握自己手里，它可以快速跟进。比如，用跟进策略做一个Cursor类似的产品。

这时候，这两家公司的竞争会如何展开？

肖弘： 今天我们看到所有国内、国外模型公司，都有自己的应用和开放平台的——基本都做了Chatbot和一个开放平台，第三方可以通过API调用它。

这里有个事情是：我们对AGI的理解是什么？它应该还是有公共产品属性的，原厂应该不会什么事都做。

第一，有巨多的事，它不会每个事都做。比如说特定行业的事，一般不会做。

第二，特别辛苦的事，它可能也不会做，或者说需要很多工程师的。

我去Google，看到4:00pm人在遛狗，我觉得他们应该不至于搞100个工程师跟大家卷很具体的应用。

因为对它来说，把壁垒最好的那部分抓在手里就好了，其他事情交给别人去做，对它来说更好。

张小珺：反正可以通过API收钱。

肖弘： 对。

张小珺：所以，（作为AI应用创始人，）不能做最肥的那块业务。

肖弘： 对，但有些当然可能有窗口期——比如长期看它会做，短期还没顾得上——这种事情在今天很考验创业者。有些人选择做，有些人选择不做。

有窗口期的事情要不要做？大家得到的答案不同。

比如在上一场战争，应用商店，后来我们知道会被原厂做对吧？但在那个moment，有第三方应用商店出现，在窗口期从创业角度得到很好结果，也有被并购掉对吧？

但这一次有窗口期的事情怎么做？窗口期内要取得什么样的成绩？去为下一步做什么样的准备？这些是更复杂的问题了。

总结一下——基于API的生意，1、我觉得垂直领域、特定领域的，可能原厂不会做；2、脏活累活，可能原厂不会做；3、有一些原厂可能以后会做，有窗口期。

所谓窗口期复杂就复杂在——也许你做得很好，它就不做了——这不是逻辑推导出来的。

你假定它一定会做，或者它一定不会做，都不一定。有可能真的在生态里面，有一个领头羊做得很好，可能原厂也就不会做了。

今天是非常灵活的，没有确定答案。

对立面是什么？那就是原厂会做的事——Chatbot，看上去大家都是会做的。

“OpenAI很遗憾，

DeepSeek的思考展示

是整个人类第一次看到”

张小珺：为什么大家都要做Chatbot？Chatbot在争什么？

肖弘： 我倒不用争什么的视角看，大家也不是用争什么这个视角。而是它挺符合对AGI的想象——一个对话界面，啥都能干。

大家好像觉得我光做个模型不够，至少得有个Chatbot。

By the way，在所有人中，我感觉DeepSeek对要不要做Chatbot，反而是最佛的。但到今天为止，他却取得最好结果。

张小珺：为什么呢？

肖弘： 首先我说佛，它是在12月份才有自己的App，更早有网页版。你看它的App，会觉得真的“套壳”——只是把模型能力用一个最简单的基础的“壳”展示出来。

张小珺：套自己的“壳”。

肖弘： 另一个角度：如果（DeepSeek）没有做这件事，这次影响和传播不会那么大。因为很多用户是用上了、看到了它的App，看到思考过程，有巨大用户体验提升，又导致大量传播——但这一切是意料之外。

本身这件事肯定非常复杂，有各种各样的原因，中美地缘政治背景，有开源、闭源背景。

我想说的是：我最大感受，这件事情精神上给大家很大鼓励！——从旁观者角度，可能他们也没想给大家鼓励。

今天大家可能也会想，开源火了，要不要开源？要不要构建技术品牌？各种各样的思考。但最重要的是， DeepSeek 一直按自己的节奏在做——Be Yourself！

他一直在开源，前面没火他也在开源，只是在按照自己的节奏做事情。

我记得我们在微信聊天，你问我，如果我是其他几家foundation model公司，我会怎么办？我后来想一下——就是“做自己”最重要，而不是“应激”。

当然foundation model公司创始人们，取得成绩比我们大很多啊。我只是假定，如果我在经营公司，在这种时候最重要的还是按自己节奏来。你会发现简单做好技术，也会得到巨大奖励。尽管这不可复制。

张小珺：能不能讲讲你对DeepSeek这个产品的感受？

肖弘： Perplexity的CEO发了一条推特说，在AI时代有两个巨大体验创新：一是，Perplexity把这句话从引用哪个网页标注出来，增加结果可信度。

二是，把LLM思考过程展示出来。

抛开开源或技术各种指标——我聊了一些老家的朋友，他们能感受到DeepSeek巨大不一样是：DeepSeek把怎么想这个问题的过程展示出来了，这是体验创新。

当然OpenAI o1，也有思考，但 OpenAI很遗憾——DeepSeek的思考过程展示可能是整个人类第一次看到这个事情，因为 OpenAI o1是要收费的！

最近它才把思考过程全部展示出来。它是怕别人可能看到思考过程，有这个数据去做自己的训练。所以它就展示简化版的。说实话，看上去没有太大意思。

首先，因为OpenAI收费，有门槛，很多人根本不知道这回事。

其次，它也没有把思考过程完整展示出来，所以o1错过了体验创新。

DeepSeek思考过程放出来，本身就是巨大体验提升。还联网。o1此前不联网。

还有一点，确实它的模型质量很好。大家原来体验过的基线是普通水平，但DeepSeek新模型，拉到了第一梯队体验。写出的文章就是好很多，聊天更有情商，本身模型能力进化很好，体验上有创新。创新可以很容易被大家感知到，而不是被各种各样的门槛堆起来。

张小珺：OpenAI定义了产品的迭代——第一个是Chatbot（聊天机器人），通过 ChatGPT这个产品，我们知道了Chatbot的用户形态；第二个是Reasoner（推理者），它做了o1，可是没让用户真正感受到技术和产品的链接，反而是从DeepSeek感受到 Reasoner的威力。

还有一点，前段时间我们做了一个播客。去对比阅读DeepSeek-R1和Kimi K1.5的论文，发现Kimi在它的产品体验上刻意让回答变短，而DeepSeek的输出是长的。

以前大家以为从用户定义上输出短更好，但DeepSeek却反直觉，是长更好，大家喜欢看它思考。

肖弘： 对。我们自己最近做Agent产品也有这个感受。

我们要教他：你少用点bullet point（要点总结），不要一点点，太总结了，你就逐字写出来就好了。这个也很神奇。

最开始大家觉得精炼一点会好。当大家发现Chatbot都是精练的输出，就会说，你多讲一讲、我多看一看。

张小珺：总结一下，DeepSeek它不仅是技术强，产品定义也是不错的对吧？

肖弘： 我觉得应该这么说——它把技术上的创新点，以一个用户可感知的方式展示了出来，而且这个展示不仅是产品层面展示，比如免费，可能一般你不会把它当做一个产品策略，而是一个商业化或经营策略。

OpenAI不放出o1思考过程，可能没有那么用户导向——它在想别人拿到这个就可以去训模型了——会有一点竞争（思维）。

所以我会说DeepSeek很单纯。

我做出来了，拿个东西给大家感受到——巨好。没有那么多事情。

张小珺：你怎么看待DeepSeek更长远的战略卡位？

肖弘： 我不知道。可能DeepSeek还在考虑——主要精力在开源模型，还是把DeepSeek当做OpenAI一样的重要消费者产品，把它商业化？我不确定他们会怎么思考这件事，但今天它确实在一个非常好的位置。

我不确定DeepSeek是否会把做一个超级App当做这家组织的目标？很多时候是选择出来的。

OpenAI如果不是Sam Altman而是Ilya是CEO，可能不会把ChatGPT变成今天这个样子。

这个还是很动态。

但不管怎样。今天DeepSeek的模型进步，DeepSeek这个App在全世界的反响——尽管我觉得无法复制，也是振奋人心的。

“所以我想：OK，还不够，

应该有个虚拟机”

张小珺：刚才我们在聊原厂会做什么。原厂看起来都会做Chatbot。

肖弘： 当然Chatbot本身还在快速进化，包括你看人类对未来想象里面，所谓的AI Assistant（AI助理），就是你跟他说一句话，他帮你把事干了，帮你把东西查了。

这是符合人类想象的，原厂肯定会做这个东西。

张小珺：应用公司呢？

肖弘： 当然有争议。有些投资人或founder持有这个观点：OK，Chatbot是原厂一定会做的，那我们就不做，躲开它。

我自己没有那么悲观。

今天的技术还在快速发展中，是不是直接你就把它当成不能做？有点早。

坦白讲，我们最近Agent产品，看上去应该就是一个Chatbot，这是很符合大家想象的。

但它在应用这一侧做的事情又很复杂，而且这种复杂还不是像Monica，做了很多，比如说“功能”。它要用好这些模型就挺复杂的——我觉得值得试一试。

有点像我刚刚说的在开放平台里第三类产品：哪怕有窗口期你也值得试一试。

张小珺：Agent的定义是“大语言模型调动外部世界”，它跟之前我们看到的那些产品有本质区分吗？

肖弘： Agent这个概念2023年就有了，但一直没有真正被大家感受到的产品形态。

也许朱啸虎会说我不相信Agent，就像他说我不相信AGI一样。也许明年这个时候他会说我相信Agent了（笑）——希望如此。

Agent就是能感知环境，自主执行任务。你给它一句话很抽象，它能把这个任务搞定。

过去几年，Agent领域低于预期最核心的原因是：模型不够聪明，没办法自动搞定很多事。

第二，之前，包括我们在做Monica的过程，我们说：好，它能执行任务，那行，我们给它接一些API，我们一个个给它接。

光有语言模型不够，它要联网搜索，我就给它接一个搜索API；它要能读知识库，好，我们去做一个知识库，让用户可以上传文件，查一遍知识库，给你答案；它要做PPT、画图…

我们在开发Monica的过程，就是给它做了一大堆API，把各种各样API都往上接。但你有没有发现——这个事情很像做功能机 ——功能机就是，诶，用户需要这个？好！当时的手机厂商就专门做一个feature phone。

Feature phone的感觉就是，一个一个feature加起来的phone。

张小珺：堆叠起来。

肖弘： 所以我在做Monica过程中，坦白讲，尽管Monica已经集成了很多东西，也确实花了很长时间，但感觉像在做feature phone，功能机——你在给它一个个接API。

但真正的Agent，应该是自己能写代码，调用API并执行。它能搞定很多长尾任务，而且不需要开发者自己写，这才是符合大家对Agent的想象。

我记得有位前辈，白鸦（有赞创始人），我跟他说Monica做到极致，把很多东西都集成进去。

他说：Red，极致是不够的，个性化才够——做到极致你就是hao123，做到个性化你才是Google。这是非常具有启发意义的一句话，我们花了很多时间研究。

当我看到Cursor，各种各样的写代码的公司出现，越来越大众化，而不是越来越给工程师用。今天你访谈很多工程师，他能挑出很多毛病，越资深的工程师会挑出越大的毛病，但小白越来用越爽。

而且我记得当时Cursor出来之后，又有竞争对手叫Windsurf，Windsurf有一个跟Cursor不一样的地方。但Cursor后来也跟进了YOLO模式，这个名字很神奇，Y-O-L-O。很像年轻一代的人会说词。