专栏名称: GiantPandaLLM
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
目录
相关文章推荐
GiantPandaLLM  ·  图解Vllm ... ·  昨天  
51好读  ›  专栏  ›  GiantPandaLLM

【CUDA 优化】让RMSNorm变得更快

GiantPandaLLM  · 公众号  · 3D  · 2025-05-09 23:41

正文

请到「今天看啥」查看全文


。在这篇博文中,我们要计算矩阵 中每一行的RMS Norm,其中 ,给定权重





请到「今天看啥」查看全文