专栏名称: GiantPandaLLM
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
目录
相关文章推荐
GiantPandaLLM  ·  图解Vllm ... ·  昨天  
GiantPandaLLM  ·  【博客转载】Row-Major VS ... ·  2 天前  
51好读  ›  专栏  ›  GiantPandaLLM

大语言模型推理,用动画一看就懂!

GiantPandaLLM  · 公众号  · 3D  · 2024-10-09 22:35

正文

请到「今天看啥」查看全文



Model:

模型就像个预言家,根据你输入的内容,预测下一个词会是什么,这个预测结果叫做 logits 。它代表了模型预测的当前下一个词在词表里的概率,模型的第一次前向推理称之为 prefill(装填)阶段,而后续的前向推理称之为decode(解码)阶段。

Sampler:

Sampler 就像从词表中抓阄,参考 logits 里指示的概率来选定下一个词。比如上述动图例子里,通过模型的四次前向推理,我们依次输出了 " promising







请到「今天看啥」查看全文