【[33星]avataRL:从零开始用纯强化学习训练语言模型,挑战传统预训练模式。亮点:1. 跳过传统预训练阶段,直接用GRPO优化训练;2. 采用Flash Attention 2,内存复杂度降低至O(n);3. RMSNorm代替LayerNorm,速度提升约2倍】
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师 |
![]() |
宝玉xp · 学好基本功,AI才能真正助你一臂之力作者:M ... · 7 小时前 |
|
人工智能产业链union · 【AI加油站】第十四部:《LLM ... · 15 小时前 |
|
人工智能产业链union · 【AI加油站】第十四部:《LLM ... · 15 小时前 |
|
人工智能产业链union · 【AI加油站】第十三部:《Transform ... · 2 天前 |
|
GevinView · 扣子空间:重新定义 AI ... · 2 天前 |
|
GevinView · 扣子空间:重新定义 AI ... · 2 天前 |
|
量子位 · 苹果炮轰推理模型全是假思考!4个游戏戳破神话 ... · 2 天前 |
![]() |
宝玉xp · 学好基本功,AI才能真正助你一臂之力作者:Manda Putra-20250611021639 7 小时前 |
|
人工智能产业链union · 【AI加油站】第十四部:《LLM 应用开发实践笔记》(附下载) 15 小时前 |
|
人工智能产业链union · 【AI加油站】第十四部:《LLM 应用开发实践笔记》(附下载) 15 小时前 |
|
人工智能产业链union · 【AI加油站】第十三部:《Transformer入门到精通》(附下载) 2 天前 |
|
GevinView · 扣子空间:重新定义 AI 协同办公,从工具到 “数字同事” 的进化之路 2 天前 |
|
GevinView · 扣子空间:重新定义 AI 协同办公,从工具到 “数字同事” 的进化之路 2 天前 |
|
量子位 · 苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃 2 天前 |
|
幽默与笑话集锦 · 【天天笑话】有一种冷,叫你妈觉得你冷!同意吗? 8 年前 |
|
女神读书会 · 就在明天!讲座通知 | 宋丽丹:西方社会“中产阶级危机”的真相 7 年前 |
|
陆家嘴金融 · 留给中国追赶发达国家的时间,只有10年 7 年前 |
|
裕彬宏观价值守望者 · 重磅!特朗普访华前夕换将,美联储新掌门如何撼动全世界? 7 年前 |
|
人民日报 · 【关注】马化腾天天看你的聊天记录?微信官方这样说… 7 年前 |