专栏名称: 企业存储技术
企业存储、服务器、SSD、灾备等领域技术分享,交流 | @唐僧_huangliang (新浪微博 )
目录
相关文章推荐
漳视新闻  ·  漳州人注意!今天下午2:45后禁止 ·  5 小时前  
漳视新闻  ·  漳州三中科技拔尖创新班来了! ·  8 小时前  
福建司法  ·  司法蓝·点亮青春梦:高考加油! ·  昨天  
漳视新闻  ·  扩散!今起3天,漳州人请这么做! ·  昨天  
漳视新闻  ·  接好运!漳州出道的“学霸男团”! ·  2 天前  
51好读  ›  专栏  ›  企业存储技术

解锁DeepSeek-R1 671B FP8推理性能:5,921 token/s @ AMD MI3...

企业存储技术  · 公众号  ·  · 2025-02-27 07:40

正文

请到「今天看啥」查看全文


下面您将找到 MI300X 和 H200 的说明。以下说明假定模型已下载。

在 MI300X 上

  1. 下载 Docker 容器:

    docker pull rocm/sglang-staging:20250212

  2. 运行docker容器:

    docker run -d -it --ipc=host --network=host --privileged --device=/dev/kfd --device=/dev/dri --device=/dev/mem --group-add render --security-opt seccomp=unconfined -v /home:/workspace rocm/sglang-staging:20250212

    docker exec -it  bash

  3. 运行服务基准测试:

    HSA_NO_SCRATCH_RECLAIM=1 python3 -m sglang.launch_server --model/workspace/models/DeepSeek-R1/ --tp 8 --trust-remote-code

    运行客户端请求

concurrency_values =( 128 64 32 16 8 4 2 1 )

for concurrency in "${ concurrency_values [@] }" ; do

python3 -m sglang.bench_serving \

--dataset-name random \







请到「今天看啥」查看全文