正文
Money never sleep, 尽管一开始被时差和偏见遮蔽了视线,海外资本市场还是对DeepSeek的发布做出了剧烈的反应——在意识到一家被技术封锁的中国LLM“小作坊”用三十分之一的算力成本(GPU小时数)就训练出接近OpenAI最新o1模型的效果之后,投资人对NVIDA乐观的GPU需求预测产生了怀疑:
在FOMO(Fear of Missing Out)情绪引发的这波抢购热潮停歇后,被DeepSeek泼了一盘冷水的互联网“冤巨头”们是否还愿意给NVIDA抬轿子?
或者干脆砍单止损?
而美股这波AI牛市的发动机,正是拥有惊人估值的NVIDA。
无怪乎NVIDA在除夕夜带着一众互联网股票纷纷跳水,仿佛一夜之间估值的底层假设——AI基础设施对GPU的旺盛需求——已经不复存在了。
但从历史的经验看,这个推理有失严谨。生产效率的优化可能带来短期内对原料的需求减少,但这一技术进步带来的成本优势将转化为应用场景的翻倍,并最终传导到对供给端更多的需求上。
这一机制,最初由英国经济学家威廉·斯坦利·杰文斯(William Stanley Jevons)在1865年发现:蒸汽机效率的提高并非减少了,而是导致了对煤炭需求的持续增长,这是因为高效的蒸汽机逐渐进入了社会生产的每一个角落。这一反常识的现象后被命名为“杰文斯悖论”(Jevons Paradox)。
而在IT行业,杰文斯悖论的变体以“安迪比尔定律”的名字众所周知: What Andy gives, Bill takes away。每当摩尔定律给Intel带来更高效的处理器,Windows和其他新软件都能把性能压榨光。在智能手机时代,内存永远不够用的你一定对这个定律带来的痛苦深有体会。算力技术的效率升级,本身就会激发应用端的创新,带来更多的需求,而这会创造出对算力供给永无止境的渴望。
在当前跑马圈地的阶段,DeepSeek的方法如果能给业界带来10倍的效率提升,那这种提升并不会意味着改用10倍小的GPU集群来训练出当前水平的模型,而是应当用规划中的大规模GPU集群,甚至是要再追加算力去训练10倍强的模型,以争取更加领先的技术地位。
从财务的角度看,这是非理性的豪赌。但在战略的高度,这是加速竞争下的必然选择:不选择跟的玩家,会以比过去快10倍的速度被甩下。所以我们看到Meta选择大幅增加资本支出至 600 亿至 650 亿美元以扩大其人工智能(AI)基础设施,这并非对DeepSeek的忽视,相反,这是对DeepSeek重塑竞争格局的理性应对。而NVIDA的股价,亦在一日后迎来了一波合理的反弹。
和对美国釜底抽薪的嘲讽相对应的,则是对DeepSeek不吝赞美的追捧。
游戏科学创始人冯骥甚至提出DeepSeek是一个堪称国运级别的科技成果,认为其算力优化的策略已经突破了美国以芯片禁运为核心对中国AI技术发展的遏制体系。
似乎美国过去的技术和工具封锁没有起到效果,中国完全能够用手头有限的算力资源,实现对美国AI产业的弯道超车,彻底打破半导体技术“小院高墙”的枷锁。