专栏名称: 蚂蚁技术AntTech
分享蚂蚁集团的技术能力和技术文化。
目录
相关文章推荐
极客之家  ·  2.3k star,开源的一体化监控利器! ·  3 天前  
码农翻身  ·  写文章赚了700多万,算不算多? ·  昨天  
蚂蚁技术AntTech  ·  蚂蚁交互智能实验室21篇论文入选CVPR2025 ·  昨天  
程序员的那些事  ·  趣图:当我准备修改 Web 服务器配置文件的时候 ·  4 天前  
51好读  ›  专栏  ›  蚂蚁技术AntTech

研讨会预告|NeurIPS 2024 蚂蚁 Workshop 邀您参加

蚂蚁技术AntTech  · 公众号  · 程序员  · 2024-12-10 15:36

正文

请到「今天看啥」查看全文



1

主题

ReaLHF:基于参数重分配的高效RLHF训练大语言模型


嘉宾

清华大学交叉信息院助理教授-吴翼


内容

介绍一种新颖的参数重分配方法,旨在提升RLHF(基于人类反馈的强化学习)的训练效率








请到「今天看啥」查看全文