专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
51好读  ›  专栏  ›  腾讯科技

独家对话Manus肖弘:世界不是线性外推,做博弈中的重要变量

腾讯科技  · 公众号  · 科技媒体  · 2025-03-07 14:04

正文

请到「今天看啥」查看全文


张小珺:相当于是先在那里等着模型能力变强。

肖弘: 啊,对!

可以开源一个创业idea:你预判下一个能力是什么,先把这部分应用给好好做好。等着这个能力有了,你就…

你等到那个时候再去做,其实就晚了,对吧?

因为总有一些人,不管是他信仰这个,还是他对foundation model(基座模型)更了解,或者Cursor我就做编程领域。总有些人会去做这个产品。

这也很有意思。你看VC投资难度也变大了——因为当你看到那个产品,因为模型能力不ready,它好像不太work,一用感觉很傻;但等到模型ready,它突然就很厉害了。到那个时候它的商业化做得也比较好。

它的曲线是一个跳变。

张小珺:但是你看,现在模型能力先行,当模型发的时候原厂可能准备不足。作为一个应用公司,你可以在前面等着它,由于它模型能力变强,带来你的爆发式增长。

这个时候原厂,模型掌握自己手里,它可以快速跟进。比如,用跟进策略做一个Cursor类似的产品。

这时候,这两家公司的竞争会如何展开?

肖弘: 今天我们看到所有国内、国外模型公司,都有自己的应用和开放平台的——基本都做了Chatbot和一个开放平台,第三方可以通过API调用它。

这里有个事情是:我们对AGI的理解是什么?它应该还是有公共产品属性的,原厂应该不会什么事都做。

第一,有巨多的事,它不会每个事都做。比如说特定行业的事,一般不会做。

第二,特别辛苦的事,它可能也不会做,或者说需要很多工程师的。

我去Google,看到4:00pm人在遛狗,我觉得他们应该不至于搞100个工程师跟大家卷很具体的应用。

因为对它来说,把壁垒最好的那部分抓在手里就好了,其他事情交给别人去做,对它来说更好。

张小珺:反正可以通过API收钱。

肖弘: 对。

张小珺:所以,(作为AI应用创始人,)不能做最肥的那块业务。

肖弘: 对,但 有些当然可能有窗口期——比如长期看它会做,短期还没顾得上——这种事情在今天很考验创业者。 有些人选择做,有些人选择不做。

有窗口期的事情要不要做?大家得到的答案不同。

比如在上一场战争,应用商店,后来我们知道会被原厂做对吧?但在那个moment,有第三方应用商店出现,在窗口期从创业角度得到很好结果,也有被并购掉对吧?

但这一次有窗口期的事情怎么做?窗口期内要取得什么样的成绩?去为下一步做什么样的准备?这些是更复杂的问题了。

总结一下——基于API的生意,1、我觉得垂直领域、特定领域的,可能原厂不会做;2、脏活累活,可能原厂不会做;3、有一些原厂可能以后会做,有窗口期。

所谓窗口期复杂就复杂在——也许你做得很好,它就不做了——这不是逻辑推导出来的。

你假定它一定会做,或者它一定不会做,都不一定。有可能真的在生态里面,有一个领头羊做得很好,可能原厂也就不会做了。

今天是非常灵活的,没有确定答案。

对立面是什么?那就是原厂会做的事——Chatbot,看上去大家都是会做的。



“OpenAI很遗憾,

DeepSeek的思考展示

是整个人类第一次看到”


张小珺:为什么大家都要做Chatbot?Chatbot在争什么?

肖弘: 我倒不用争什么的视角看,大家也不是用争什么这个视角。而是它挺符合对AGI的想象——一个对话界面,啥都能干。

大家好像觉得我光做个模型不够,至少得有个Chatbot。

By the way,在所有人中,我感觉DeepSeek对要不要做Chatbot,反而是最佛的。 但到今天为止,他却取得最好结果。

张小珺:为什么呢?

肖弘: 首先我说佛,它是在12月份才有自己的App,更早有网页版。你看它的App,会觉得真的“套壳”——只是把模型能力用一个最简单的基础的“壳”展示出来。

张小珺:套自己的“壳”。

肖弘: 另一个角度:如果(DeepSeek)没有做这件事,这次影响和传播不会那么大。因为很多用户是用上了、看到了它的App,看到思考过程,有巨大用户体验提升,又导致大量传播——但这一切是意料之外。

本身这件事肯定非常复杂,有各种各样的原因,中美地缘政治背景,有开源、闭源背景。

我想说的是:我最大感受,这件事情精神上给大家很大鼓励!——从旁观者角度,可能他们也没想给大家鼓励。

今天大家可能也会想,开源火了,要不要开源?要不要构建技术品牌?各种各样的思考。但最重要的是, DeepSeek 一直按自己的节奏在做——Be Yourself!

他一直在开源,前面没火他也在开源,只是在按照自己的节奏做事情。

我记得我们在微信聊天,你问我,如果我是其他几家foundation model公司,我会怎么办?我后来想一下——就是“做自己”最重要,而不是“应激”。

当然foundation model公司创始人们,取得成绩比我们大很多啊。我只是假定,如果我在经营公司,在这种时候最重要的还是按自己节奏来。你会发现简单做好技术,也会得到巨大奖励。尽管这不可复制。

张小珺:能不能讲讲你对DeepSeek这个产品的感受?

肖弘: Perplexity的CEO发了一条推特说,在AI时代有两个巨大体验创新:一是,Perplexity把这句话从引用哪个网页标注出来,增加结果可信度。

二是,把LLM思考过程展示出来。

抛开开源或技术各种指标——我聊了一些老家的朋友,他们能感受到DeepSeek巨大不一样是:DeepSeek把怎么想这个问题的过程展示出来了,这是体验创新。

当然OpenAI o1,也有思考,但 OpenAI很遗憾——DeepSeek的思考过程展示可能是整个人类第一次看到这个事情,因为 OpenAI o1是要收费的!

最近它才把思考过程全部展示出来。它是怕别人可能看到思考过程,有这个数据去做自己的训练。所以它就展示简化版的。说实话,看上去没有太大意思。

首先,因为OpenAI收费,有门槛,很多人根本不知道这回事。

其次,它也没有把思考过程完整展示出来,所以o1错过了体验创新。

DeepSeek思考过程放出来,本身就是巨大体验提升。还联网。o1此前不联网。

还有一点,确实它的模型质量很好。 大家原来体验过的基线是普通水平,但DeepSeek新模型,拉到了第一梯队体验。写出的文章就是好很多,聊天更有情商,本身模型能力进化很好,体验上有创新。创新可以很容易被大家感知到,而不是被各种各样的门槛堆起来。

张小珺:OpenAI定义了产品的迭代——第一个是Chatbot(聊天机器人),通过 ChatGPT这个产品,我们知道了Chatbot的用户形态;第二个是Reasoner(推理者),它做了o1,可是没让用户真正感受到技术和产品的链接,反而是从DeepSeek感受到 Reasoner的威力。

还有一点,前段时间我们做了一个播客。去对比阅读DeepSeek-R1和Kimi K1.5的论文,发现Kimi在它的产品体验上刻意让回答变短,而DeepSeek的输出是长的。

以前大家以为从用户定义上输出短更好,但DeepSeek却反直觉,是长更好,大家喜欢看它思考。

肖弘: 对。我们自己最近做Agent产品也有这个感受。

我们要教他:你少用点bullet point(要点总结),不要一点点,太总结了,你就逐字写出来就好了。这个也很神奇。

最开始大家觉得精炼一点会好。当大家发现Chatbot都是精练的输出,就会说,你多讲一讲、我多看一看。

张小珺:总结一下,DeepSeek它不仅是技术强,产品定义也是不错的对吧?

肖弘: 我觉得应该这么说——它把技术上的创新点,以一个用户可感知的方式展示了出来,而且这个展示不仅是产品层面展示,比如免费,可能一般你不会把它当做一个产品策略,而是一个商业化或经营策略。

OpenAI不放出o1思考过程,可能没有那么用户导向——它在想别人拿到这个就可以去训模型了——会有一点竞争(思维)。

所以我会说DeepSeek很单纯。

我做出来了,拿个东西给大家感受到——巨好。没有那么多事情。

张小珺:你怎么看待DeepSeek更长远的战略卡位?

肖弘: 我不知道。可能DeepSeek还在考虑——主要精力在开源模型,还是把DeepSeek当做OpenAI一样的重要消费者产品,把它商业化?我不确定他们会怎么思考这件事,但今天它确实在一个非常好的位置。

我不确定DeepSeek是否会把做一个超级App当做这家组织的目标?很多时候是选择出来的。

OpenAI如果不是Sam Altman而是Ilya是CEO,可能不会把ChatGPT变成今天这个样子。

这个还是很动态。

但不管怎样。今天DeepSeek的模型进步,DeepSeek这个App在全世界的反响——尽管我觉得无法复制,也是振奋人心的。


“所以我想:OK,还不够,
应该有个虚拟机”

张小珺:刚才我们在聊原厂会做什么。原厂看起来都会做Chatbot。
肖弘: 当然Chatbot本身还在快速进化,包括你看人类对未来想象里面,所谓的AI Assistant(AI助理),就是你跟他说一句话,他帮你把事干了,帮你把东西查了。
这是符合人类想象的,原厂肯定会做这个东西。
张小珺:应用公司呢?
肖弘: 当然有争议。有些投资人或founder持有这个观点:OK,Chatbot是原厂一定会做的,那我们就不做,躲开它。
我自己没有那么悲观。
今天的技术还在快速发展中,是不是直接你就把它当成不能做?有点早。
坦白讲,我们最近Agent产品,看上去应该就是一个Chatbot,这是很符合大家想象的。
但它在应用这一侧做的事情又很复杂,而且这种复杂还不是像Monica,做了很多,比如说“功能”。它要用好这些模型就挺复杂的——我觉得值得试一试。
有点像我刚刚说的在开放平台里第三类产品: 哪怕有窗口期你也值得试一试。
张小珺:Agent的定义是“大语言模型调动外部世界”,它跟之前我们看到的那些产品有本质区分吗?
肖弘: Agent这个概念2023年就有了,但一直没有真正被大家感受到的产品形态。
也许朱啸虎会说我不相信Agent,就像他说我不相信AGI一样。也许明年这个时候他会说我相信Agent了(笑)——希望如此。
Agent就是能感知环境,自主执行任务。你给它一句话很抽象,它能把这个任务搞定。
过去几年,Agent领域低于预期最核心的原因是:模型不够聪明,没办法自动搞定很多事。
第二,之前,包括我们在做Monica的过程,我们说:好,它能执行任务,那行,我们给它接一些API,我们一个个给它接。
光有语言模型不够,它要联网搜索,我就给它接一个搜索API;它要能读知识库,好,我们去做一个知识库,让用户可以上传文件,查一遍知识库,给你答案;它要做PPT、画图…
我们在开发Monica的过程,就是给它做了一大堆API,把各种各样API都往上接。但你有没有发现——这个事情很像做功能机 ——功能机就是,诶,用户需要这个?好!当时的手机厂商就专门做一个feature phone。
Feature phone的感觉就是,一个一个feature加起来的phone。
张小珺:堆叠起来。
肖弘: 所以我在做Monica过程中,坦白讲,尽管Monica已经集成了很多东西,也确实花了很长时间,但感觉像在做feature phone,功能机——你在给它一个个接API。
但真正的Agent,应该是自己能写代码,调用API并执行。它能搞定很多长尾任务,而且不需要开发者自己写,这才是符合大家对Agent的想象。
我记得有位前辈,白鸦(有赞创始人),我跟他说Monica做到极致,把很多东西都集成进去。
他说:Red,极致是不够的,个性化才够——做到极致你就是hao123,做到个性化你才是Google。 这是非常具有启发意义的一句话,我们花了很多时间研究。
当我看到Cursor,各种各样的写代码的公司出现,越来越大众化,而不是越来越给工程师用。今天你访谈很多工程师,他能挑出很多毛病,越资深的工程师会挑出越大的毛病,但小白越来用越爽。
而且我记得当时Cursor出来之后,又有竞争对手叫Windsurf,Windsurf有一个跟Cursor不一样的地方。但Cursor后来也跟进了YOLO模式,这个名字很神奇,Y-O-L-O。很像年轻一代的人会说词。






请到「今天看啥」查看全文


推荐文章
禅茶一味  ·  经典微小说:《轮回》
8 年前
硕士博士读书会  ·  小男孩5分钟祷告,一夜间传遍朋友圈!
8 年前
历史震惊你  ·  唐宋八大家书法名篇,见字如见人
8 年前