专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
目录
相关文章推荐
程艺Truman  ·  程艺Truman 20250604171709 ·  15 小时前  
极客之家  ·  22k star,微软硬核开源,让 ... ·  昨天  
老刘说NLP  ·  两个有趣的工作:Huggingface知识图 ... ·  2 天前  
51好读  ›  专栏  ›  OSC开源社区

三位全球顶尖专家解码DeepSeek崛起与开源革命

OSC开源社区  · 公众号  · 程序员  · 2025-01-31 22:00

正文

请到「今天看啥」查看全文


上周在达沃斯论坛期间,我收到很多非技术类商业领袖的提问。而就在周一,股市出现了“DeepSeek 抛售潮”:Nvidia 英伟达和其他一些美国科技公司的股价大幅下跌。(截至写作时,股价已略有回升。)

我认为,DeepSeek 让很多人意识到了以下几点:

中国在生成式 AI 领域正在追赶美国

2022 年 11 月 ChatGPT 发布时,美国在生成式 AI 领域遥遥领先。尽管印象改变往往较慢,但即便最近,我还听到很多来自美国和中国的朋友表示,认为中国仍然落后。但事实上,在过去两年里,这一差距已经迅速缩小。

随着中国一些模型如 Qwen(我的团队已经使用了几个月)、Kimi、InternVL 和 DeepSeek 的发布,中国在这一领域显然在追赶,而且在视频生成等领域,甚至已经有时超越了美国。

我非常高兴 DeepSeek-R1 作为开放权重模型发布,并且附带了详细的技术报告。相比之下,一些美国公司则不断推动出台监管措施,借助炒作 AI 灾难(如人类灭绝)来打压开源。

现在已经显而易见,开源和开放权重模型是 AI 供应链的重要组成部分,许多公司将使用它们。如果美国继续压制开源,中国将主导这一供应链的部分,许多企业最终将使用更符合中国价值观的模型,而非美国的。

开放权重模型正在将基础模型层商品化

正如我之前所说,LLM 的 token 价格正在快速下降,而开放权重模型助推了这一趋势,并为开发者提供了更多选择。例如, OpenAI 的 o1 模型每百万输出 token 的价格为 60 美元,而 DeepSeek R1 的价格仅为 2.19 美元。这一近 30 倍的价格差异,让许多人意识到价格下降的趋势。

训练基础模型并提供 API 接入服务是一个充满挑战的行业。许多从事这一领域的公司仍在寻找方法来弥补巨额的训练成本。文章《AI 的 6000 亿美元问题》很好的展示了这一挑战(但我认为这些基础模型公司做得非常棒,我希望它们能成功)。

相比之下,在基础模型上构建应用程序则创造了很多商业机会。现在,其他公司已经花费数十亿美元训练出这些模型,你只需花费几美元就能使用这些模型,构建客服聊天机器人、邮件摘要、AI 医生、法律文件助手等各种应用。

规模化并不是 AI 进步的唯一途径

关于规模化推动 AI 进步的讨论最近有些过热。公平地说,我曾是规模化早期的支持者。 许多公司通过炒作“只要获得更多资本,就能扩大规模并且稳定地推动改进”这一论调,成功筹集了大量资金。

因此,大家过于专注于规模化,而忽视了推动 AI 进步的其他更多途径。 受美国 AI 芯片禁运的影响,DeepSeek 团队不得不进行大量优化,最终使得模型在性能较差的 H800 GPU 上也能运行,成本控制在不到 600 万美元(不包括研发费用)。

目前尚不清楚这一举措是否真的会减少对计算能力的需求。 有时每个单位商品的价格下降反而会促进更多的购买。我认为,在长远来看,智能和计算的需求几乎没有上限 ,因此,我对未来人类将使用更多智能持乐观态度,即使这种智能变得更加便宜。

我在社交媒体上看到很多对 DeepSeek 进展的解读,就像一场罗夏墨迹测试,大家根据自己的理解对其进行解读。 我认为 DeepSeek-R1 的发布具有深远的地缘政治意义 ,尽管这还需要进一步分析。







请到「今天看啥」查看全文