正文
DeepSeek的实控人、创始人,是一位出生在广东湛江的85后,名叫梁文锋。
中学时代他就表现出极大的数学天赋。2002年,17岁的梁文锋以吴川一中“高考状元”的成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。
在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。
2015年,幻方量化正式成立,2019年,其资金管理规模突破百亿元。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。
2023年,他进军通用人工智能领域,并创办了深度求索DeepSeek。
梁文锋首次进入公众视野,是在2025年1月20日,他出席了总理主持的“专家、企业家和教科文卫体等领域代表座谈会”,并出现在新闻联播的画面中
(下图右)
:
DeepSeek之所以有如此大的杀伤力,是因为它颠覆了此前美国发展人工智能大模型的主流模式,甚至可以打破美国对中国的高阶芯片限制。
DeepSeek有着惊人的颠覆性,它主要体现在超低成本、超高效率上。
比如它
仅用 2048 块英伟达 H800 GPU 和 557.6 万美元的投入,就训练出规模达 6710 亿参数的 DeepSeek-V3;
而市面上同等参数规模的 GPT-4 训练花费被认为高达 10 亿美元左右。
之前美国发展人工智能大模型的方式:
用巨量的高阶GPU和大量资金、大量尖端人才来堆砌。
而DeepSeek只用了很少的低阶GPU,少量的资金和人才,就开发出了跟美国最先进大模型不相上下的产品。
DeepSeek应用的下载量,最近几天连续霸榜苹果美国应用商店免费APP下载排行榜,超越了ChatGPT。
在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。
DeepSeek的低成本、高效率模式,让美国AI领域体验到了“被颠覆”的感觉。一时间,全球的投资人都在谈论DeepSeek、体验DeepSeek。
为什么英伟达的股价被“干翻在地”?因为DeepSeek的模式可能意味着,作为人工智能核心硬件的GPU,产能不是严重不足,而是可能接近于饱和了。