Linear-MoE：线性注意力遇上混合专家的开源实践

机器之心 · 公众号 · AI · 2025-05-29 19:38

正文

项目地址：https://github.com/OpenSparseLLMs/Linear-MoE

过去两年，线性序列建模技术取得了显著进展，其核心优势在于线性时间复杂度的训练和恒定内存占用的推理。

这类模型主要分为三大类：线性注意力（Linear Attention）、状态空间模型（SSM）和线性 RNN（Linear RNN），代表性工作包括 Lightning Attention、GLA、Mamba2、RWKV 等。

已有研究工作表明，这些模型实际上可以通过统一的递归形式进行表达，如下表所示。这也反映出，尽管三类方法分别出自不同的技术流派，但已逐渐收敛至统一的表达形式。

推荐文章

新机器视觉 · CCD（像素）与视觉系统的基础知识

20 小时前

新智元 · 高考第一天，用豆包修图3.0花式「整活」送祝福，已原地笑翻！

昨天

爱可可-爱生活 · 【Specification Engineering：探索AI工-20250607115819

昨天

机器之心 · 全球圈粉6000万，被国内粉丝催着上线，PixVerse「国内版」一手实测来了！

昨天

人工智能那点事 · 粉丝已破百万！北大“韦神”突然开号？评论区成许愿池……

2 天前

百姓关注 · 这几种塑料袋有毒，能致癌、致畸！你却每天都在用，更危险的是...

8 年前

杭州交通918 · 摊上大事了！浙江180多名司机一起被抓，陆续还有人自首…

8 年前

尚榜 · 【今日热点】邯郸100多残疾弃婴喊这位残疾女子“妈妈”

8 年前

教育百师通 · 傻一点的人，真幸福！说的就是你，赶紧看～

8 年前

圆圆谈营销 · 如何撩到理性而挑剔的中高产

8 年前