国产大模型震惊海外我怎么看？

红衣大叔周鸿祎 · 公众号 · 科技自媒体 · 2025-01-05 15:55

正文

这家公司首次被人记住是因其发布 2.0 开源模型时提供了史无前例的性价比，模型推理成本降至每百万个 token 约一元，约为 LLaMA的1/7、GPT 的1/70，故而 DeepSeek 被称为 AI 界的拼多多，掀起国产大模型价格战 ，字节跳动、腾讯、百度、阿里纷纷降价。

如今开发者能享大模型福利，DeepSeek 功不可没。

为何今日要提及此事？

过去我常说中美 AI 核心差距不大，约半年左右，主要差距在算力。因核心算法公开，多为工程化方法，模型也是开源的，差距实则不大，可很多人不信，一些专家还带节奏，称论 AI 实力美国领先，中国最多第二梯队，美国遥遥领先，我对此不敢苟同。

有人妄自菲薄还让众人灰心，长他人的志气灭自己的威风，对中国 AI 产业发展无益。

如今 DeepSeek 发布的模型有力回击了这些言论。微软、脸书、谷歌都在朝着10万卡集群做大模型训练时，DeepSeek 仅用2000个 GPU，花费不到600万美金和两个月时间，就做出一个与全球顶尖大模型能力对齐的开源大模型。

有人质疑说，新推的大模型是用国外模型知识蒸馏而来，但知识蒸馏方法人人可用，为何他人未做到？

此次效率大幅提升，肯定是在底层架构上有不同于其他巨头的创新，DeepSeek 定有不为人知的训练方法和工程实践方法。

推荐文章

甲子光年 · 产学研深度融合样本：高校教授携手昇腾，共筑AI算力生态基石｜甲子光年

7 小时前

云技术 · 88万元，数据可视化系统大单：帆软中标

昨天

云技术 · 88万元，数据可视化系统大单：帆软中标

昨天

云南司法行政 · 复议为民 | 楚雄州行政复议专题网站上线

昨天

云南司法行政 · 复议为民 | 楚雄州行政复议专题网站上线

昨天

李楠或kkk · 乌克兰的卡车无人机袭击稍微变化一下，也可以搞潜艇无人机袭击啊。。-20250603145243

昨天

李楠或kkk · 如果你真的认为在中国任何人都无法使用星链，那么我估计你不但理工科-20250602190325

2 天前

腾讯科技 · 一月新增2000万月活，连续两年登顶App store榜首，Faceu激萌的产品操盘逻辑与挑战

8 年前

小鹿情感先生 · 当女生雅蠛蝶，真男人都这样啪到

7 年前

鱼羊密史 · 她比妾还卑贱，父子共用，有时也用来招待客人！

7 年前

壹季体能训练营 · 壹季课表｜成都 10月30日-11月5日

7 年前

券商中国 · 券商科技变革的又一样本：方正证券构建客户服务新生态

7 年前