专栏名称: 真格基金

真格基金是由新东方教育科技联合创始人徐小平、王强和红杉资本中国在2011年联合成立的天使基金。世纪佳缘、兰亭集势、聚美优品、一起作业、美菜、小红书、蜜芽、找钢网、英雄互娱、大姨吗、51Talk等多家公司已经成为真格基金投资的明星企业。

真格基金戴雨森：长聊 AI Agent，各行业都会遭遇「李世石时刻」（下）

真格基金 · 公众号 · 科技投资 · 2025-04-01 10:00

正文

请到「今天看啥」查看全文

Q：关于这个事情你是在 2024 年就有了清晰的认知？还是说在受到 DeepSeek 带来的冲击或者启示之后，才有了更清楚、更坚定的想法？

戴雨森： 我觉得这也是一个不断学习的过程。我们 80 后入行的时候，移动互联网已经逐渐兴起，或者说互联网已经进入下半场了。在最早期，比如 90 年代的时候，我那时候也是互联网用户，但当时根本没考虑过商业模式的问题。我觉得应该经常以史为鉴，想想为什么很多早期的互联网公司，都是凭借当时很强的技术做起来的。

其实复盘一下 Google 遇到的第一个问题，它用 PageRank 这项新技术打造出了体验好 10 倍的搜索引擎，用户特别喜欢，还自发传播。但那个时候它其实不知道怎么赚钱，因为一开始谷歌的搜索引擎是没有广告的，界面很清爽。1998 年上线后，2002 年《纽约时报》有篇文章就说「Google最难搜索的就是它自己的商业模式」，批评它没有自己的商业模式。但后来大家也知道了，2002 年它逐渐找到了 AdWords 和 AdSense 这两种商业模式，2004 年上市后成了现在最好的「印钞机」。这是个很好的例子，一开始你问 Google 商业模式是什么，它其实也不知道。 但它首先是有技术突破，凭借技术打造出好产品，然后再把产品的价值变现。

Q：所有的技术突破都会有这样水到渠成的过程吗？还是说我们存在幸存者偏差，只是看到了那些后来取得巨大商业成就的技术突破？

戴雨森： 当然，不可能所有的技术突破都能赚钱。不过我觉得，得看技术突破处于哪个发展周期。我还是那个观点，现在是一个技术变化斜率很陡峭的时候，那这个时候，要是逼着现有的技术去变现，就好比让一个天资聪颖的高中生去赚钱，他可能只能去做些搬砖之类的活，赚不了什么大钱。但要是多培养他，等他成为博士生，那就能赚大钱。所以我觉得，如果技术发展已经到了平缓期，比如移动互联网，五年前的技术和现在没太大区别的时候，那才是商业模式百花齐放的时候。

我再举个例子，不只是 Google，Facebook 刚出现的时候，提出了一个非常前沿的产品，引发了「病毒式」传播。但那时候大家也不知道 Facebook 怎么赚钱。它尝试过放横幅广告，尝试过本地广告，后来还做过游戏中的广告，可这些都没赚到什么钱。直到2012年，它把 news feed 从时间排序（就像微信那样的排序方式）改成了推荐排序，形成了所谓的信息流推荐模式。只有做成了推荐信息流排序，才能插入广告。所以它在 2012 年推出了信息流广告（news feed ads），并且同年上市。当然现在信息流广告也是超级「印钞机」，字节跳动的核心商业模式。但 Facebook 是 2005 年上线的，信息流在 2007 年上线，推荐信息流是在 2012 年上线，同时找到了真正的商业模式，这中间花了 6 到 8 年的时间。那时候 Facebook 一直是用户很喜欢、但商业模式不清晰的公司，所以伟大的公司往往都经历过这样的阶段。

Q：你觉得字节跳动会开源吗？

戴雨森： 首先，开源是不是每个人都必须做的事？第一，得处于领先地位，开源才有价值。要是开源一个不怎么样的东西，只是为了开源而开源，那没什么意义；第二，我觉得开源稍微弱一点的形式就是免费。免费加领先，我觉得这就很厉害了。

是不是一定要开源？我觉得这次 DeepSeek 有个「甜头」——它开源后引起了西方的高度关注。在美国引发大新闻后，回到国内大家就更觉得它厉害了，让美国人「破防」了。当然，开源也有像和微信合作这样的形式，但我在想这不仅仅是开源的问题，而是公司得坚持做这件事。比如说，假设现在豆包开源，微信会接入吗？我估计不会。所以这不是开不开源的简单问题。假设豆包现在和 DeepSeek 一样厉害然后开源了，我估计微信也不会接入，阿里的千问估计也不会。这不是说它们能力不行，而是从阿里和字节的立场来看是这样。 所以我觉得梁文锋他们厉害的地方不只是开源，而是他们坚持开源，而且他们的市场定位是一个不会让大家感到威胁的定位。

Q：对，坚持开源，而且保持中立，没有接受某个大厂特别多的投资。

最近还有个变化，就是 OpenAI 也在考虑开源。阿尔特曼（Altman）发了一条推特，给大家两个选项：一个是可以开源 o3 mini，还有一个是可以开源 phone size 的 model，就是一个适用于手机端的模型。你更期待它开源哪个呢？

戴雨森： 当然，我觉得开源哪个都很好，但我肯定对 o3 mini 更感兴趣。因为我觉得目前手机端的模型用途可能还不是那么大，现在大家更需要在智能前沿取得突破。o3 mini 是一个很强大的模型，在经过较长的推理时间，也就是现在 GPT 里的 o3 mini pro、o3 mini high 模式下，它的表现非常好。如果这样级别的模型能够开源，大家能知道它是怎么做出来的以及它的特点，我觉得对大家会有非常大的价值。而且听说这个模型的规模也不大，所以这可能对大家在模型训练和应用方面会有很多借鉴意义。

Q：你听说它有多大？

戴雨森： 比较可靠的消息来源，听说它每次激活的规模是 3.7B 的大小，这确实让我有点震惊，感觉确实有点太小了。但这个尺寸意味着，他们确实能把一个很大的 o3（o3 应该是挺大的），变成一个很小的 o3 mini，然后让 o3 mini 经过更多的思考时间，从而得到很好的结果，这确实是一项很厉害的工作。

Q：他们之前其实分享过自己不开源的顾虑，他们认为开源会削弱竞争优势，比如会给 Google 可乘之机。

戴雨森： 所以我觉得这是梁文锋伟大的点，他确实把很多技术秘密分享给大家，让大家都能变得更好。但从纯商业公司的角度来看，确实会有很多担心。毕竟除了刚刚说的问题，OpenAI 还担心强大的 AI 会被坏人利用，这可能也是一个很合理的担忧。

Q：你觉得 DeepSeek 对那些本来就在开源生态里想要主导的公司，比如 Meta 和阿里这样一直都在开源的公司，会有什么影响呢？

戴雨森： 我觉得肯定是一种激励。大家发现来了一个更「卷」的对手，原来开源社区，开玩笑地说有点像「赛博佛祖」，有点做慈善的感觉。不管是阿里还是 Meta，都是大公司拿出算力给大家用，带动整个行业发展。但现在来了一个进步更快、更开放的 DeepSeek，这肯定对大家来说既是压力也是激励。但确实，我觉得 DeepSeek 的中立性是一个比较独特的优势，腾讯也可以用、千问也可以用，这不仅仅是能力的问题，是他的屁股坐在哪儿的问题。

Q：苹果最近不是也和 DeepSeek 有过沟通合作之类的吗，不过最后它选择了阿里。

戴雨森： 苹果和很多公司都聊过，也和 Kimi 聊过。我觉得从苹果的角度来看，选择阿里很好理解。它肯定要选一个服务稳定，能很好应对大规模用户量，不管是 infrastructure、服务还是技术经验等方面都很出色的合作伙伴。

Q：其实这一轮阿里还是比较开放的。

戴雨森： 千问和 Llama 挺兼容的，而且它的产品模型不错，更新也很频繁，所以其实很多开发者都在用千问。说实话，DeepSeek 的 R1 在使用的时候，因为存在很多「幻觉」，所以如果用它来做应用，可能不一定是最好的选择。

Q：在 DeepSeek 全民爆火之前，在海外技术圈，我觉得千问和 DeepSeek 的影响力是比较相当的，因为它们俩都是开源系列的。

戴雨森： 确实，复盘一下就会发现，不管 Kimi 的 benchmark 做得多好，如果对别人不开放，不能开源使用，也不提供海外应用服务，那在海外确实就没有认知度。

Q：你们之前是怎么讨论的，Kimi 为什么不开源？

戴雨森： 我觉得即便到现在，开源也不是一件必须要做的事情。就像我刚才说的，开源只是公司在某些情况下的一种选择。比如说，在没有保密竞争压力、没有融资压力的情况下才会考虑开源，而且我们现在看到的是事后的结果，因为开源再加上一些偶然的机会才会有现在的情况，所以我觉得开源不是必备选项。当然，选择开源的人很厉害，非常值得尊敬。但对于一家商业公司来说，核心还是在于能不能创造用户价值，并最终将用户价值转化为商业价值，所以我觉得 开源不是必经之路，只是一条很有意思、很创新的路。

Q：但今天所有的探索 AGI 的公司都不会以用户价值作为核心的。

戴雨森： 很多还是以技术价值为主。我只是说在技术增长期，只有技术价值提升了才能带来用户价值。所以我觉得在技术前沿进行探索是非常关键的。大模型出现之后，可能涌现出了一批所谓比较务实的投资人或创业者，他们想着用现有的技术去赚钱。但我觉得 Kimi 肯定属于另外一类，它是要推动技术前沿的提升，这又回到我们一开始说的，打造出令人惊叹、如魔法般的产品体验，最终获得商业价值。

其实 Kimi 在 2023 年火起来，它火一个很重要的原因是，它是第一个把 chat、搜索和长文本结合起来的产品。大当时 ChatGPT 是不能搜索的，而且 ChatGPT 对于长文本、多文本、多文件的处理也不是很好。所以 Kimi 在前两三年，就是凭借着长文本处理的技术理念，以及将搜索和聊天相结合，带来了不一样的用户体验，从而成功出圈的例子。

Q：当年选择做长文本是非共识吗？做这个决策很难吗？

戴雨森： 其实当时长文本肯定是技术选择中的一个选项，但要不要把它放在最重要的位置去做，我觉得这并没有达成共识。当时有个不知道真假的段子，据说百度在 Kimi 火了之后，就说为什么 Kimi 做了长文本他们却没做，好像是说长文本的优先级没排在他们第一批要做的事情里。因为当时还有很多其他优先级更高的事情可以做，比如也有很多人做 CharacterAI，做那种情商方向的对齐。但 Kimi 坚定地选择了长文本，并且把它做到了极致。因为长文本能解锁两个关键场景，一个是处理多个文件，第二个就是搜索，比如看 100 个网页然后进行总结，这两个场景没有长文本是做不出来的。

尤其在当时，Kimi 刚成立，还没融到那么多钱。团队也是年轻人、小团队，资源受限，必须专注在一件事情上，选择一个正确的方向。其实 DeepSeek 现在火的很多因素，放到 2023 年的 Kimi 身上也是成立的。当资源有限的时候，就要在一个关键的点上实现突破，给用户带来那种非常惊艳的体验，这样才能出圈。所以我总结了一下，发现有很多相似的地方，这不是往自己脸上贴金，我是真觉得它们有一些相似之处。

Q：那长文本对 Kimi 现在做的事情有帮助吗？

戴雨森： 比如说同样做 retrieval，Kimi 在 truthfulness、准确度方面其实做得更好。当然，普通用户可能不会去这么对比。说实话，现在很多用 DeepSeek 的用户，对于产生的「幻觉」是没感觉的，但说不定你用它写个报告，回头就被坑了。我昨天就遇到了这种情况，在一个群里，群里的人还都挺有水平的，有人发了篇文章，我一看，里面 DeepSeek 味道怎么那么浓。