专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  【[17星]gpupoor:为RTX ... ·  昨天  
爱可可-爱生活  ·  【[1.8k星]Drawnix:一款一体化开 ... ·  昨天  
宝玉xp  ·  转发微博-20250603073219 ·  2 天前  
黄建同学  ·  Google 最近更新了来自世界一流公司的 ... ·  2 天前  
爱可可-爱生活  ·  本文颠覆性地提出大块推理时训练(LaCT)框 ... ·  2 天前  
51好读  ›  专栏  ›  爱可可-爱生活

本文颠覆性地提出大块推理时训练(LaCT)框架,通过采用极大词元-20250603052146

爱可可-爱生活  · 微博  · AI  · 2025-06-03 05:21

正文

请到「今天看啥」查看全文


本文颠覆性地提出大块推理时训练(LaCT)框架,通过采用极大词元块(2K-1M)进行快速权重更新这一反直觉策略,在无需定制硬件核的情况下显著提升了GPU利用率(高达70%)和模型状态容量(可达模型参数40%),并在新视角合成、语言建模和视频生成等多种长序列任务中展现了卓越性能与可扩展性,为高效长上下文建模开辟了新道路。






请到「今天看啥」查看全文