专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
小互AI  ·  Anthropic研究报告:揭秘 ... ·  昨天  
小互AI  ·  Anthropic研究报告:揭秘 ... ·  昨天  
爱可可-爱生活  ·  【[437星]Claude Code ... ·  2 天前  
人工智能那点事  ·  你抢不到的专家号,他们0.02秒就能挂一个… ... ·  2 天前  
爱可可-爱生活  ·  “如何讲一个好故事”精华解读版 ... ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

本文提出的对数线性注意力通过引入基于芬威克树的、随序列长度对数级-20250607060236

爱可可-爱生活  · 微博  · AI  · 2025-06-07 06:02

正文

请到「今天看啥」查看全文


本文提出的对数线性注意力通过引入基于芬威克树的、随序列长度对数级增长的隐藏状态集合,巧妙地平衡了线性注意力的效率与softmax注意力的表达能力,其O(T log T)的训练复杂度和O(log T)的解码复杂度,以及在长上下文任务上对现有线性模型的改进,为高效序列建模提供了一个极具潜力的新方向,尽管其实现复杂度和与Transformer的性能差距仍是挑战。






请到「今天看啥」查看全文