专栏名称: AI科技评论
点评学术,服务 AI !
目录
相关文章推荐
beebee星球  ·  从不穿内裤的我,因为这条裤儿破功了! ·  15 小时前  
看理想  ·  这档视频节目,竟然可以免费看 ·  13 小时前  
六根  ·  韩浩月 | 不断搬家的布衣书局 ·  昨天  
梅特涅的信徒  ·  资治通鉴:鸿门宴 ·  2 天前  
51好读  ›  专栏  ›  AI科技评论

AIGCode宿文:我就是要自训练大模型,直接做「L5」| AI产品十人谈

AI科技评论  · 公众号  ·  · 2025-05-16 17:59

正文

请到「今天看啥」查看全文


AI Coding 的公司。难道你们是一家大模型公司吗?

宿文: 我们的确是一家 AI Coding 的公司,做大模型是我们通往 AGI 的必经之路。

首先是在这次创业的思考中,我的第一个落足点在于,什么样的场景可以通往 AGI。在我看来,陪伴聊天一定不是,聊天的语料数据,基本上对于提升模型智力没有帮助。那个场景能沉淀下来啥?

我也考察过其他的场景,法律、税务、游戏、营销,那个时间点上,大模型太热了,各个行业都要垂直大模型,我们看到的是,不论是行业语料也好,还是成熟度也好,都远远达不到我内心中对于实现 AGI 的条件。你要知道,那时候还在 16 个月之前,当时的产品成熟度比现在差多了,国内用户是很难接受的,商业上根本无法闭环。

最后我们回归到代码上。 从技术上来说,代码是一个高质量的样本,也是最主要的 合成 数据,从商业上来说,它也能实现短平快的闭环。 程序员用户的优点是专业能力强,接受工具的开放度高。Cursor 为什么能起来?程序员可能觉得现在的补齐率很低、采纳率很低,但是他们还是会用,这就会形成一个比较健康的商业模式。

所以我们选择了代码,通过代码来做大模型。但是我们现在并不追求泛化能力的变现,那是后半程才会去做的事情。

AI 科技评论:国外的 C oding 公司里你最喜欢哪家?

宿文: Cursor,他们对整个赛道的布局和判断基本上跟大模型是同步的。Cursor 不是跟随者,在判断有 GitHub Copilot 的情况下,既能坚定地先改一套 IDE,还有自己的创新点,并且迭代速度快到能在大厂的车轮前抢钱,随后又很快地意识到没有自己的模型不行,开始碰模型这件事儿。我觉得 Cursor 在代码补齐这个赛道上目前的思路还挺清晰的。

AI 科技评论:你们创业有受到 Cursor 的影响吗?

宿文: 有研究和参考, Cursor 给我们最重要的一个启示,就是不要做他们那个方向。

原因很简单,首先 Cursor 服务于程序员,这就不是一个特别好服务的用户群体。其次程序员一定会选择全球最好的一款 Copilot 类产品,我们跟在 Cursor 后面,一定是晚的。另外更关键的问题是,Copilot 类产品最终要跟 IDE 打交道,未来怎么跟生态位上最大的公司微软 PK,我一直没想明白。我觉得初创公司与其解决这个问题,不如自己训练大模型。

Poolside 和 Magic 两家公司在没有发布任何产品的情况下,估值就达到了 30 亿美金。Cursor 现在有很漂亮的 ARR 收入,但是之前估值都比 Poolside 低,一个很重要的原因就是它没模型。硅谷的定价逻辑是为技术壁垒付费,做模型的公司估值就高。但话说回来,大模型这个事本身有壁垒,你做的有没有壁垒是另外一回事。”

复刻一个代码补齐的产品,从生态到技术上都不太对。我们走的是一条更激进,或者说终结的道路。我们不 Copilot,做 Autopilot。

AI 科技评论:不做 Copilot,做 Autopilot,这是 什么原因吗?

宿文:Autopilot 其实应该说是几代人的梦想了。 上世纪 80 年代 IT 产业爆发的时候,就有了低代码和零代码概念,因为程序员贵,写代码慢啊。可以说是自从有了程序员,我们就想把“程序员”这个职业给干掉。那一代没有把代码供给的历史使命完成,我们可以用大模型继续做这件事。

只要有人参与到写代码的事情中,就不可能做到多快好省。 只有完全交给模型和算力,才能实现我们的终极目标:在二进制的世界里做代码供给。

AI 科技评论:既然已经有了终极目标,那你们的短期、中期和长期目标分别是什么?

宿文:短期目标以今年年底为节点,从 用户 流量和收入层面,验证 AutoCoder 这个“端到端的、能够替代掉程序员的”产品的 PMF。 相较于自动驾驶,Coding autopilot 的好处是没有任何安全法规的卡点,可以直接通过商业化进行迭代。其实 AutoCoder 四月已经在国内上线内测了,我们没有做大规模推广,目前通过口碑裂变有三百多个“产品经理”用户在帮助我们打磨产品,给我们提供了上百条有效建议和 idea。我们计划本月上线美国市场,最初两个月的目标会是寻找死忠用户继续迭代产品。从今年 Q3 开始,增长和商业化数据才会成为运营团队的 OKR。

中期目标是打通软件的生态。 软件已经是存量市场,众多软件沉淀下来的数据要供 Agent 调用,Agent 的底层是代码供给,而大模型第一天生成出来的东西就是代码承接。有时候大家在想大模型的 OS 是什么,其实就是能提供一整个生态的东西,这里的桥接点应该是一个有全链路能力的代码生成。

长期目标是实现 AGI。我认为以任何形式,能够彻底实现 Autocoding 的,就是 AGI。

短期先活下去,中期从今年年底开始算,用两年左右的时间把生态位打通,再往后可能需要三五年的时间实现 AGI。


2

直接干 L5,做一件反共识的事情






请到「今天看啥」查看全文