专栏名称: ZOL中关村在线
看科技资讯、查产品报价,上中关村在线。
目录
相关文章推荐
哎咆科技  ·  iPhone 的隔空投送,要被删除了? ·  8 小时前  
EETOP  ·  资料分享|功率半导体(VDMOS,IGBT, ... ·  19 小时前  
面包板社区  ·  拆解一个9.9包邮的充电按键小夜灯,成本6.5? ·  2 天前  
面包板社区  ·  拆解一个9.9包邮的充电按键小夜灯,成本6.5? ·  2 天前  
51好读  ›  专栏  ›  ZOL中关村在线

DeepSeek本地模型显卡横评,显存不够算力都白搭

ZOL中关村在线  · 公众号  · 硬件  · 2025-03-28 17:50

正文

请到「今天看啥」查看全文


测试使用LM Studio,无加速框架进行对比,完全凭借显卡自身算力。毕竟不同加速框架对不同厂商的显卡优化不同,测试变量太大。

这里我们首先选择【DeepSeek R1 Distill Qwen 32B】模型。

DeepSeek本地模型显卡横评 显存不够算力都白搭 将GPU卸载拉满,这意味着DeepSeek模型将完全由GPU进行计算,其他参数默认即可。 由于AI模型每次回答都会有所区别,这里设置3个问题,取平均值。

DeepSeek本地模型显卡横评 显存不够算力都白搭 另外需要注意的是,我们设置的问题本身框定了范围,让AI在思考回答时不会过于发散。 如果问“什么是哲学”这类无范围的问题,每次回答的结果将无法量化。

在32B模型中,可以看到RTX 5090 D的tok/sec还是很快的,毕竟作为本代旗舰产品,32GB大显存本就适合AI训练。







请到「今天看啥」查看全文