本文提出了一种名为SEFT的新型稀疏LLM微调方法,它通过在微调过程中动态演化模型的稀疏连接(允许重新激活被剪枝的权重)并利用敏感度指导稀疏性保持,从而在不牺牲模型稀疏性的前提下,显著提升了剪枝LLM在下游任务上的性能和计算效率,其核心反直觉之处在于证明了“死而复生”的权重连接对模型适应性的重要价值。
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师 |
|
新智元 · 爆火AI编程Windsurf突遭Claude ... · 16 小时前 |
|
量子位 · 陶哲轩转发!华人数学博士后反超DeepMin ... · 18 小时前 |
|
新智元 · 陶哲轩再爆:一个月三破18年未解难题!Alp ... · 18 小时前 |
![]() |
爱可可-爱生活 · 人人能懂的AI前沿解读(6.3)网页链接 ... · 2 天前 |
![]() |
爱可可-爱生活 · 【[81星]Beam-and-Spyroso ... · 2 天前 |
|
新智元 · 爆火AI编程Windsurf突遭Claude全面断供,开发者大量退订!直接打脸OpenAI 16 小时前 |
|
量子位 · 陶哲轩转发!华人数学博士后反超DeepMind AI,停滞18年数学问题1个月内3次突破 18 小时前 |
|
新智元 · 陶哲轩再爆:一个月三破18年未解难题!AlphaEvolve彻底改写数学研究规则 18 小时前 |
![]() |
爱可可-爱生活 · 人人能懂的AI前沿解读(6.3)网页链接 -20250603081411 2 天前 |
![]() |
爱可可-爱生活 · 【[81星]Beam-and-Spyrosoft/rtest:为-20250602220755 2 天前 |
|
译言 · 第九区推荐|闲聊八卦,推动人类进化的主要动力 8 年前 |
|
江南晚报 · 500吨韩国进口旧衣被查获!含大量童装、内衣,有些甚至来自太平间……你还敢穿吗? 7 年前 |
|
健康时尚百科 · 20年前没空调,我们是这样过夏天的,看哭所有人 7 年前 |
|
基少成多 · 白酒B跑赢了多少白酒股 7 年前 |
|
十点读书 · 优雅的女人离不开这10点 7 年前 |