正文
AI不再依赖于用户最初编写大篇幅又精确的提示语,让AI的易用性和生成内容的质量直接提升了一个巨大的台阶。
这样的优化是全面的,不拘泥于DeepResearch和做图领域,还包括编程,例如AI编程领域,已经有Devin、GitHub Copilot、AWS Developer Q、Codeium Windsurf、Cursor等多家公司。我们距离完全无代码编程可能只有一步之遥了。
从最近一年AI的进步来看,
也许最大的进步并不是基础模型有多么根本性的推进,而是能以较低成本交付稳定、确定的结果,这让AI一步步地更接近可以自然整合进入工作的工具。
02.
从可见到不可见的AI整合
OpenAI不仅自己在推出各种AI产品,也在大刀阔斧地收购。
5月6日,美国知名商业媒体彭博披露OpenAI达成约30亿美元收购协议,这是OpenAI最大的一宗并购案,并购对象是一家叫Windsurf的AI编程公司。在收购案前一天,CEO
瓦伦·莫汉(Varun Mohan)接受采访时,宣布Windsurf将围绕“vibe coding”重塑开发文化。
什么是“vibe coding”?这是一种完全无代码的”编程“方式。
过去,作为AI使用的一大领域——编程,开发者还是希望将AI的代码整合到自己的项目中,再不济,也要对AI编写的代码进行人工审查。
但很快问题来了,AI的效率太高,输出代码数量太大,维护难度和成本都很大。所以“vibe coding”概念被提出,开发者用自然语言(或语音、图像、示例代码)描述需求,程序即刻产出可运行的雏形,然后根据这个可用的雏形,开发者继续对话式微调,形成“边用边改”的循环。到这一步,已经完全不面对”代码“了。
当然,到这一步,也很难称呼这样的人员为”开发者“了。比如就用Windsurf CEO的话说,这样的工作人员叫“builder”(建设者、建立者)。而到这一步,“vibe coding”基本就要替代前后端服务器端的很多程序员,这是一个既令人兴奋,又令人恐惧的前景。
从“vibe coding”里我们可以看到一个AI带来的工作困境,即AI效率太高,其产出的内容已经很难用人的速度进行审阅,所以干脆不看,直接用自然语言和最终产品交互。这样的场景是否会仅仅出现在编程领域?
《失控玩家》
除了写作,笔者一直在进行播客的制作。现在的AI生成对话式文本不再是问题,再用一个语音模型进行配音也轻车熟路。最后给播客节目起标题、制作封面图都可以用AI完成。
我们来假设一个问题,如果这套流程满负荷启动,一个人每天能生产多长时间的播客内容?
用这个问题询问ChatGPT o3,它的回答是,一天8小时工作可以生成超过30小时的内容。
这还是已经加入了一些“检查”步骤的情况,如果抽去其中的“检查”,一天生产48小时的播客内容也是很有可能的。也就是说,一个人可以完成至少10个播客的日更2小时对话节目。
如果文字转视频更成熟一些,直接生成30秒短视频,发短视频平台呢?或者直接根据短视频平台的某种模板生成类似情节和内容的短视频呢?一个人每天能生产多少短视频,能同时管理多少帐号?当然,这个点子一点不新鲜,甚至已经有人在这样做了。
这里强调的是,到这一步,我们早就不是以经典的方式在使用AI了——即我们提供提示语,AI提供结果,我们再拿这个结果加入我们的工作流,用AI的思考嵌入我们的思考。
但因为二者思考速度的差异过大,我们大可以放弃思考,把一部分工作全部交给AI完成,我们再也不用做二次加工和质检,全部让AI完成就好。
03.
如果AI能做,你还要不要思考?
这促使我们思考一个问题,
到底有什么是人“非想不可”的?
如果很多人做短视频就是为了赚钱,如果可以借AI,同时开五十个短视频账号,以AI生成视频覆盖宠物、母婴、美食探店等全部赛道,这个人为什么还要思考?
假设你在网上有些不喜欢的创作者,如果有一个功能,例如针对某篇文章,AI直接生成400字的关于这篇文章的最关键的批判。以后你讨厌的创作者每发一篇文章,你就点这个按钮,甚至设置成自动任务,那么你还要不要认真阅读文章本身,要不要阅读AI撰写的回复?