专栏名称: 澎湃新闻
有内涵的时政新媒体
目录
相关文章推荐
人民日报  ·  听劝!这类菜真的可能致癌,建议少吃! ·  昨天  
人民日报  ·  北大回应韦东奕健康问题 ·  昨天  
51好读  ›  专栏  ›  澎湃新闻

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

澎湃新闻  · 公众号  · 社会  · 2025-05-28 09:42

正文

请到「今天看啥」查看全文


无论对中国还是全球,整合多元异构算力已不再是权宜之计,而是技术演进、成本压力和应用多样化之下的一个必然方向。

2025年5月,上海模速空间,无问芯穹公司门口。澎湃新闻记者 李佳蔚 图

中国算力资源的一大突出特点是多元异构。市场上主流CPU生态有5种以上,GPU生态则多达10种以上,不同的算力芯片、服务器形态、存储形态,以及网络形态组合配置在一起,可以形成成百上千的组合。

“没有用不完的英伟达GPU,也不是必须用英伟达的GPU。”夏立雪说,AI企业如今更关注“用对芯片”,而非“用贵芯片”。掌握整合多元异构算力的核心技术,是中国确保人工智能安全、可靠、可控的一部分。

他进一步谈到,“打开水龙头,我们可能不知道水是从哪个水库过来的,只知道它是标准化的自来水。同理,作为算力运营商,我们要调用不同的基座模型、使用不同的算力芯片,最终为AI企业提供标准化的算力服务。”

【对话夏立雪】

澎湃新闻:这两年大模型技术更迭非常快,每年都有新焦点,你对行业变化有什么感受?

夏立雪: 这两年人工智能发展飞速变化,前年我们在讨论大语言模型,去年多模态已经进入视野,今年的推理模型大家也习以为常了,技术飞快地迭代。随着模型能力增强,背后是模型的体量增大。

人工智能依然遵循Scaling Law(尺度定律),对算力的需求越来越大,大到了一个什么程度?大到了你不能再假设你的资源是无限的。前两年训练模型的时候,很多大厂有一个基本假设,算力是无限的,至少在做单一任务时算力是无限的。但是,现在这个假设的边界已经逼近,我们需要考虑,中国的算力资源是有限的,怎么去解决模型持续增长的问题?

DeepSeek提供了一个很好的例子,它没有用“大力出奇迹”的方式,而是用低成本、高效率的方式,在资源有限的情况下造出了一个好模型。所以,在打造更好的模型方面,现在我们需要更加精细化地把现有算力资源用好。

另外,我们还要考虑供需关系的问题。比如,当很多算力资源被用在模型训练上,而推理落地的算力需求也在上升,那后者的资源就有限了。这中间,算力资源的供需匹配和性价比是一个很大的挑战。

当前,我们特别需要把没有被用起来的算力资源充分利用,同时要确保使用效率高。如果你拿来的算力不好用,大模型跑得非常卡,三秒才出一个字,那没人愿意用。

2025年5月,上海模速空间,无问芯穹办公空间一隅。澎湃新闻记者 李佳蔚 图

澎湃新闻:算力资源有限,是中国特有的还是全球性问题?

夏立雪:







请到「今天看啥」查看全文