专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
新智元  ·  爆火AI编程Windsurf突遭Claude ... ·  16 小时前  
量子位  ·  陶哲轩转发!华人数学博士后反超DeepMin ... ·  18 小时前  
新智元  ·  陶哲轩再爆:一个月三破18年未解难题!Alp ... ·  18 小时前  
爱可可-爱生活  ·  人人能懂的AI前沿解读(6.3)网页链接 ... ·  2 天前  
爱可可-爱生活  ·  【[81星]Beam-and-Spyroso ... ·  2 天前  
51好读  ›  专栏  ›  爱可可-爱生活

本文提出了一种名为SEFT的新型稀疏LLM微调方法,它通过在微调-20250603053457

爱可可-爱生活  · 微博  · AI  · 2025-06-03 05:34

正文

请到「今天看啥」查看全文


本文提出了一种名为SEFT的新型稀疏LLM微调方法,它通过在微调过程中动态演化模型的稀疏连接(允许重新激活被剪枝的权重)并利用敏感度指导稀疏性保持,从而在不牺牲模型稀疏性的前提下,显著提升了剪枝LLM在下游任务上的性能和计算效率,其核心反直觉之处在于证明了“死而复生”的权重连接对模型适应性的重要价值。






请到「今天看啥」查看全文