|
[CUDA基础]CUDA-Learn-Notes: v3.0 大升级-面试刷题不迷路 GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
https://github.com/BBuf/Panzhihua-Mi-Yi-Pipa GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
分享一个DeepSeek V3和R1中 Shared Experts和普通Experts融合的一个小... GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
[InternLM/VL系列]InternLM2/LM2.5/ViT/VL1.5/VL2.0笔记: ... GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
[KV Cache优化]MQA/GQA/YOCO/CLA/MLKV笔记: 层内和层间KV Cache... GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
[张量/序列并行]图解 DeepSpeed-Ulysses & Megatron-LM TP/SP GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
SGLang 支持Flash Attention V3 Backend GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
DeepSeek V3/R1 推理效率分析(3):Decode 配置泛化讨论 GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
DeepSeek V3/R1 推理效率分析: 满血版逆向工程分解 GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
从零开始设计 SGLang 的 KV Cache GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
DeepSeek V3/R1 推理效率分析(1):关于DeepSeek V3/R1 Decoding... GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
谈谈DeepSeek-R1满血版推理部署和优化 GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
详解vLLM和SGLang awq dequantize kernel的魔法 GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
非常简洁的图像复原新方法:退化分类预训练,已中ICLR2025 GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
《超大规模AI实战手册》PDF领取 GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
从DeepSeek MoE专家负载均衡谈起 GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
从DeepSeek V3开源趋势重新审视大模型Infra GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
SGLang MLA 实现解析 GiantPandaLLM · 公众号 · 3D · 2 月前 · |
|
|
免费 | 抢先试用此芯Armv9 AI PC开发套件瑞莎“星睿O6” GiantPandaLLM · 公众号 · 3D · 3 月前 · |
|
|
美团基于SGLang提供INT8无损满血版DeepSeek R1部署方案 GiantPandaLLM · 公众号 · 3D · 3 月前 · |
|