专栏名称: 真格基金
真格基金是由新东方教育科技联合创始人徐小平、王强和红杉资本中国在2011年联合成立的天使基金。世纪佳缘、兰亭集势、聚美优品、一起作业、美菜、小红书、蜜芽、找钢网、英雄互娱、大姨吗、51Talk等多家公司已经成为真格基金投资的明星企业。
目录
相关文章推荐
创伙伴  ·  创伙伴知识星球内容最新更新... ·  2 小时前  
我是腾腾爸  ·  该出手时就出手!买! ·  17 小时前  
点拾投资  ·  东方红资产管理周云:下一个十年值得更加乐观 ·  18 小时前  
细嗅趋势  ·  假期最大的事我就选一个 ·  2 天前  
细嗅趋势  ·  假期最大的事我就选一个 ·  2 天前  
海南工信微报  ·  在华外企加码中国市场 愿与中国经济“同频共振” ·  2 天前  
海南工信微报  ·  在华外企加码中国市场 愿与中国经济“同频共振” ·  2 天前  
51好读  ›  专栏  ›  真格基金

真格基金戴雨森:长聊 AI Agent,各行业都会遭遇「李世石时刻」(下)

真格基金  · 公众号  · 科技投资  · 2025-04-01 10:00

正文

请到「今天看啥」查看全文



Q: 关于这个事情你是在 2024 年就有了清晰的认知?还是说在受到 DeepSeek 带来的冲击或者启示之后,才有了更清楚、更坚定的想法?


戴雨森: 我觉得这也是一个不断学习的过程。我们 80 后入行的时候,移动互联网已经逐渐兴起,或者说互联网已经进入下半场了。在最早期,比如 90 年代的时候,我那时候也是互联网用户,但当时根本没考虑过商业模式的问题。我觉得应该经常以史为鉴,想想为什么很多早期的互联网公司,都是凭借当时很强的技术做起来的。


其实复盘一下 Google 遇到的第一个问题,它用 PageRank 这项新技术打造出了体验好 10 倍的搜索引擎,用户特别喜欢,还自发传播。但那个时候它其实不知道怎么赚钱,因为一开始谷歌的搜索引擎是没有广告的,界面很清爽。1998 年上线后,2002 年《纽约时报》有篇文章就说「Google最难搜索的就是它自己的商业模式」,批评它没有自己的商业模式。但后来大家也知道了,2002 年它逐渐找到了 AdWords 和 AdSense 这两种商业模式,2004 年上市后成了现在最好的「印钞机」。这是个很好的例子,一开始你问  Google 商业模式是什么,它其实也不知道。 但它首先是有技术突破,凭借技术打造出好产品,然后再把产品的价值变现。


Q: 所有的技术突破都会有这样水到渠成的过程吗?还是说我们存在幸存者偏差,只是看到了那些后来取得巨大商业成就的技术突破?


戴雨森: 当然,不可能所有的技术突破都能赚钱。不过我觉得,得看技术突破处于哪个发展周期。我还是那个观点,现在是一个技术变化斜率很陡峭的时候,那这个时候,要是逼着现有的技术去变现,就好比让一个天资聪颖的高中生去赚钱,他可能只能去做些搬砖之类的活,赚不了什么大钱。但要是多培养他,等他成为博士生,那就能赚大钱。所以我觉得,如果技术发展已经到了平缓期,比如移动互联网,五年前的技术和现在没太大区别的时候,那才是商业模式百花齐放的时候。


我再举个例子,不只是 Google,Facebook 刚出现的时候,提出了一个非常前沿的产品,引发了「病毒式」传播。但那时候大家也不知道 Facebook 怎么赚钱。它尝试过放横幅广告,尝试过本地广告,后来还做过游戏中的广告,可这些都没赚到什么钱。直到2012年,它把 news feed 从时间排序(就像微信那样的排序方式)改成了推荐排序,形成了所谓的信息流推荐模式。只有做成了推荐信息流排序,才能插入广告。所以它在 2012 年推出了信息流广告(news feed ads),并且同年上市。当然现在信息流广告也是超级「印钞机」,字节跳动的核心商业模式。但 Facebook 是 2005 年上线的,信息流在 2007 年上线,推荐信息流是在 2012 年上线,同时找到了真正的商业模式,这中间花了 6 到 8 年的时间。那时候 Facebook 一直是用户很喜欢、但商业模式不清晰的公司,所以伟大的公司往往都经历过这样的阶段。


Q: 你觉得字节跳动会开源吗?


戴雨森: 首先,开源是不是每个人都必须做的事?第一,得处于领先地位,开源才有价值。要是开源一个不怎么样的东西,只是为了开源而开源,那没什么意义;第二,我觉得开源稍微弱一点的形式就是免费。免费加领先,我觉得这就很厉害了。


是不是一定要开源?我觉得这次 DeepSeek 有个「甜头」——它开源后引起了西方的高度关注。在美国引发大新闻后,回到国内大家就更觉得它厉害了,让美国人「破防」了。当然,开源也有像和微信合作这样的形式,但我在想这不仅仅是开源的问题,而是公司得坚持做这件事。比如说,假设现在豆包开源,微信会接入吗?我估计不会。所以这不是开不开源的简单问题。假设豆包现在和 DeepSeek 一样厉害然后开源了,我估计微信也不会接入,阿里的千问估计也不会。这不是说它们能力不行,而是从阿里和字节的立场来看是这样。 所以我觉得梁文锋他们厉害的地方不只是开源,而是他们坚持开源,而且他们的市场定位是一个不会让大家感到威胁的定位。


Q: 对,坚持开源,而且保持中立,没有接受某个大厂特别多的投资。


最近还有个变化,就是 OpenAI 也在考虑开源。阿尔特曼(Altman)发了一条推特,给大家两个选项:一个是可以开源 o3 mini,还有一个是可以开源 phone size 的 model,就是一个适用于手机端的模型。你更期待它开源哪个呢?


戴雨森: 当然,我觉得开源哪个都很好,但我肯定对 o3 mini 更感兴趣。因为我觉得目前手机端的模型用途可能还不是那么大,现在大家更需要在智能前沿取得突破。o3 mini 是一个很强大的模型,在经过较长的推理时间,也就是现在 GPT 里的 o3 mini pro、o3 mini high 模式下,它的表现非常好。如果这样级别的模型能够开源,大家能知道它是怎么做出来的以及它的特点,我觉得对大家会有非常大的价值。而且听说这个模型的规模也不大,所以这可能对大家在模型训练和应用方面会有很多借鉴意义。


Q: 你听说它有多大?


戴雨森: 比较可靠的消息来源,听说它每次激活的规模是 3.7B 的大小,这确实让我有点震惊,感觉确实有点太小了。但这个尺寸意味着,他们确实能把一个很大的 o3(o3 应该是挺大的),变成一个很小的 o3 mini,然后让 o3 mini 经过更多的思考时间,从而得到很好的结果,这确实是一项很厉害的工作。


Q: 他们之前其实分享过自己不开源的顾虑,他们认为开源会削弱竞争优势,比如会给 Google 可乘之机。


戴雨森: 所以我觉得这是梁文锋伟大的点,他确实把很多技术秘密分享给大家,让大家都能变得更好。但从纯商业公司的角度来看,确实会有很多担心。毕竟除了刚刚说的问题,OpenAI 还担心强大的 AI 会被坏人利用,这可能也是一个很合理的担忧。


Q: 你觉得 DeepSeek 对那些本来就在开源生态里想要主导的公司,比如 Meta 和阿里这样一直都在开源的公司,会有什么影响呢?


戴雨森: 我觉得肯定是一种激励。大家发现来了一个更「卷」的对手,原来开源社区,开玩笑地说有点像「赛博佛祖」,有点做慈善的感觉。不管是阿里还是 Meta,都是大公司拿出算力给大家用,带动整个行业发展。但现在来了一个进步更快、更开放的 DeepSeek,这肯定对大家来说既是压力也是激励。但确实,我觉得 DeepSeek 的中立性是一个比较独特的优势,腾讯也可以用、千问也可以用,这不仅仅是能力的问题,是他的屁股坐在哪儿的问题。


Q: 苹果最近不是也和 DeepSeek 有过沟通合作之类的吗,不过最后它选择了阿里。


戴雨森: 苹果和很多公司都聊过,也和 Kimi 聊过。我觉得从苹果的角度来看,选择阿里很好理解。它肯定要选一个服务稳定,能很好应对大规模用户量,不管是 infrastructure、服务还是技术经验等方面都很出色的合作伙伴。


Q: 其实这一轮阿里还是比较开放的。


戴雨森: 千问和 Llama 挺兼容的,而且它的产品模型不错,更新也很频繁,所以其实很多开发者都在用千问。说实话,DeepSeek 的 R1 在使用的时候,因为存在很多「幻觉」,所以如果用它来做应用,可能不一定是最好的选择。


Q: 在 DeepSeek 全民爆火之前,在海外技术圈,我觉得千问和 DeepSeek 的影响力是比较相当的,因为它们俩都是开源系列的。


戴雨森: 确实,复盘一下就会发现,不管 Kimi 的 benchmark 做得多好,如果对别人不开放,不能开源使用,也不提供海外应用服务,那在海外确实就没有认知度。


Q: 你们之前是怎么讨论的,Kimi 为什么不开源?


戴雨森: 我觉得即便到现在,开源也不是一件必须要做的事情。就像我刚才说的,开源只是公司在某些情况下的一种选择。比如说,在没有保密竞争压力、没有融资压力的情况下才会考虑开源,而且我们现在看到的是事后的结果,因为开源再加上一些偶然的机会才会有现在的情况,所以我觉得开源不是必备选项。当然,选择开源的人很厉害,非常值得尊敬。但对于一家商业公司来说,核心还是在于能不能创造用户价值,并最终将用户价值转化为商业价值,所以我觉得 开源不是必经之路,只是一条很有意思、很创新的路。


Q: 但今天所有的探索 AGI 的公司都不会以用户价值作为核心的。


戴雨森: 很多还是以技术价值为主。我只是说在技术增长期,只有技术价值提升了才能带来用户价值。所以我觉得在技术前沿进行探索是非常关键的。大模型出现之后,可能涌现出了一批所谓比较务实的投资人或创业者,他们想着用现有的技术去赚钱。但我觉得 Kimi 肯定属于另外一类,它是要推动技术前沿的提升,这又回到我们一开始说的,打造出令人惊叹、如魔法般的产品体验,最终获得商业价值。


其实 Kimi 在 2023 年火起来,它火一个很重要的原因是,它是第一个把 chat、搜索和长文本结合起来的产品。大当时 ChatGPT 是不能搜索的,而且 ChatGPT 对于长文本、多文本、多文件的处理也不是很好。所以 Kimi 在前两三年,就是凭借着长文本处理的技术理念,以及将搜索和聊天相结合,带来了不一样的用户体验,从而成功出圈的例子。


Q: 当年选择做长文本是非共识吗?做这个决策很难吗?


戴雨森: 其实当时长文本肯定是技术选择中的一个选项,但要不要把它放在最重要的位置去做,我觉得这并没有达成共识。当时有个不知道真假的段子,据说百度在 Kimi 火了之后,就说为什么 Kimi 做了长文本他们却没做,好像是说长文本的优先级没排在他们第一批要做的事情里。因为当时还有很多其他优先级更高的事情可以做,比如也有很多人做 CharacterAI,做那种情商方向的对齐。但 Kimi 坚定地选择了长文本,并且把它做到了极致。因为长文本能解锁两个关键场景,一个是处理多个文件,第二个就是搜索,比如看 100 个网页然后进行总结,这两个场景没有长文本是做不出来的。


尤其在当时,Kimi 刚成立,还没融到那么多钱。团队也是年轻人、小团队,资源受限,必须专注在一件事情上,选择一个正确的方向。其实 DeepSeek 现在火的很多因素,放到 2023 年的 Kimi 身上也是成立的。当资源有限的时候,就要在一个关键的点上实现突破,给用户带来那种非常惊艳的体验,这样才能出圈。所以我总结了一下,发现有很多相似的地方,这不是往自己脸上贴金,我是真觉得它们有一些相似之处。


Q: 那长文本对 Kimi 现在做的事情有帮助吗?


戴雨森: 比如说同样做 retrieval,Kimi 在 truthfulness、准确度方面其实做得更好。当然,普通用户可能不会去这么对比。说实话,现在很多用 DeepSeek 的用户,对于产生的「幻觉」是没感觉的,但说不定你用它写个报告,回头就被坑了。我昨天就遇到了这种情况,在一个群里,群里的人还都挺有水平的,有人发了篇文章,我一看,里面 DeepSeek 味道怎么那么浓。







请到「今天看啥」查看全文