专栏名称: 白鲸出海
白鲸出海,泛互联网出海服务平台,白鲸专注于具备互联网属性的行业、公司、产品和服务的出海,包括应用、游戏、电商、区块链、智能手机及硬件、旅游、网络文学、影视、动漫、教育、体育和金融等。
目录
相关文章推荐
百度智能云  ·  0基础也能秒懂AI客服!3分钟拆解这门课为何 ... ·  5 小时前  
阿里云开发者  ·  聊聊AI应用架构演进 ·  13 小时前  
白鲸出海  ·  快手旗下Kling ... ·  23 小时前  
白鲸出海  ·  中国互联网出海一周头条 ... ·  2 天前  
51好读  ›  专栏  ›  白鲸出海

半年冲刺500万美元ARR,华裔00后打造永不背叛的AI语音陪伴|对话创始人

白鲸出海  · 公众号  · 科技公司  · 2025-06-06 22:00

正文

请到「今天看啥」查看全文


ZP: 这是您的第一次创业,那您会如何定义自己作为一个创业者的角色,以及如何定义您的团队?

冷月: 虽然我之前做过很多个人项目,但这次确实是我第一次真正意义上的创业。在这个过程中,我也走过了很多创业者都会经历的坑,比如与联合创始人理念不合、团队成员的变动,或者在早期融资阶段缺乏经验等。 对我而言,这是一个逐渐成长的过程,我也更明白怎么去甄别并选择合适的合作伙伴和投资人。

关于我们的团队,我一直都是很感激的。我们团队成员的工程能力很强,执行力非常高,主观能动性也很强。通常只需要在任务工具上确定好,大家就会去稳步执行。每周一次的同步一般就足够保证整体的进度。

除此之外,无论是做数据还是模拟相关,团队里的大家都非常努力。大多数人都是奔着打造 AI 陪伴类产品的目标来的。在早期阶段,甚至连工资都发不出的时候,大家也依然选择留下来。

ZP: 您认为是团队的什么特质带来了这样的技术突破?您如何定义团队里每个人的角色?

冷月:我认为团队最关键的特质是 passion 和 mission-driven 的心态。我们这边的成员大多都有明确的使命感,很多人都来自开源社区,他们加入我们,并不是单纯为了完成某个任务,而是在做一件自己真正热爱的事情。 大家普遍很“卷”,不仅愿意花时间,还会不断推敲:一个东西到底哪里可以更好,怎么才能做到自己心中理想的状态。

我们的团队每个人都有自己的特点以及对应独立负责的模块。比如说,我们把一个功能需求拆解后放到 Linear 任务系统中,谁认领了,就从头做到尾。我认为这种工作方式对于公司未来的扩张特别重要:因为当一个人能完全负责一个板块,他就对其中的 bug、边界问题负有全责,不可能推诿。反过来,如果他在执行中遇到困难,也可以主动寻求团队或社区的帮助。这种机制让我们的开发协作非常高效,最大限度地减少了不必要的沟通成本,也极大增强了执行力。

ZP: 您在本次创业面临过什么样的挑战?

冷月: 如果要说最大的挑战,我认为应该是在 2023 年年底那段时间。那时我刚从英伟达离职三四个月左右,虽然我在专注于模型的开发工作,但我们在融资和联合创始人上一直没有匹配上特别合适的人选。最初我希望能有人分担商业化的部分,这样我就能更专注于模型,但后来我意识到, 作为一名创始人,不能把自己不擅长的事情完全交给别人来完成。即便找了合伙人,这个模式也应该是互补而不是完全替代。

那段时间对我来说确实是非常艰难的:信用卡债务的压力很大,计算资源紧张等等。但我们团队的大家都咬牙坚持了下来。到了今年年初,我们开始加快产品化的进程,业务逐步成型,收入也随之增长,公司的发展终于进入了相对正向的轨道。

ZP: 也想请你分享一下融资上的一些进展,比如 HF0 孵化器的相关经历?

冷月: 其实说来也巧,我们在加入 HF0 前几天刚刚完成了另一轮融资。当时有朋友强烈推荐我们去申请 HF0,我们其实早在去年就尝试过,但没有成功。今年我们再次申请,在等待结果期间,因为考虑到即将开营,所以就决定先结束了另一笔融资。

幸运的是,HF0 的申请也最终通过了。因此在很短时间内,我们连续完成了两笔融资。HF0 出来之后,我们的 traction 得到进一步验证,营收在短短两三个月内从零增长到约 400 万美元,增长非常迅速。基于这样的增长,我们的估值也顺势提升,随后又完成了新一轮融资。

再后来,在参加完 HF0 相关活动后仅两周时间内,我们便暂时关闭了上一轮融资。我们认为下一代模型(S1)发布之后,将可能对整个市场产生较大影响,因此我们希望在那之后再开启新一轮融资,以期获得更合理的估值和战略空间。

图片

Fish Audio:打造一个未来的
内容基础设施和新一代娱乐平台

ZP: 您是否经历过某个时刻,彻底刷新了对 AI 和人类交互的理解?

冷月: 我觉得很难说有一个具体的时间点,但确实有一个小插曲让我对语音交互有了更深的思考。我们团队有一位非常核心的成员,是我们运营团队的负责人,当时他正在谈恋爱,现在已经结婚了。那段时间,我们开始思考“煲电话粥”这个很多情侣之间都非常常见,包括我自己以前也经历过的事情,它背后更深的含义。我忽然意识到 语音不仅仅是文本的另一个模态,它是一个完全不同的媒介。 人在通话时,往往不需要特别集中注意力,说话是非常自然、甚至是反射性的行为。

也正因为如此, 语音不会像文字或图像那样与其他应用“抢夺屏幕时间”。 比如,当你在刷抖音的时候要同时看微信、回飞书,是非常耗费精力的;但如果只是和亲密的人挂着电话,即使没有实质内容,反而不会觉得累。这是一种完全不同的交互形态。所以我们决定要从这个认知出发,进一步让语音更加可控,情感更加丰富,延迟更低,价格更低,变得更易获取。

ZP: 您如何用⼀句话定义 fish audio?这是⼀家怎样的公司?它解决的核心问题是什么?希望能够实现什么样的最终愿景?







请到「今天看啥」查看全文