专栏名称: GiantPandaLLM
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
目录
相关文章推荐
GiantPandaLLM  ·  [Triton编程][基础]vLLM ... ·  昨天  
GiantPandaLLM  ·  图解Vllm ... ·  3 天前  
51好读  ›  专栏  ›  GiantPandaLLM

分享一个DeepSeek V3和R1中 Shared Experts和普通Experts融合的一个小...

GiantPandaLLM  · 公众号  · 3D  · 2025-04-02 23:47

正文

请到「今天看啥」查看全文



平均ITL (ms)
54.69
50.20
+8.2%
4
总吞吐量 (tok/s)
1088.59
1132.73
+4.0%

平均TTFT (ms)
2630.26
2144.08
+18.5%

平均ITL (ms)
156.21
132.75
+15.0%
8






请到「今天看啥」查看全文