【[44星]AgentsMeetRL:一个超实用的开源项目集合,专门整理了基于强化学习训练LLM Agent的开源资源。亮点:1. 涵盖多领域项目,包括数学、搜索、对话等;2. 涉及多种强化学习框架和算法;3. 提供详细的项目信息,方便开发者快速上手】
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师 |
![]() |
宝玉xp · 以后顾老师再用个AI帮你检查这事//@高飞: ... · 22 小时前 |
![]() |
黄建同学 · Antropic ... · 昨天 |
|
新智元 · 首个高考数学满分AI诞生!海淀名师审大题,给 ... · 2 天前 |
|
AI科技大本营 · MiniMax重磅开源M1模型:百万上下文超 ... · 2 天前 |
|
AI科技大本营 · MiniMax重磅开源M1模型:百万上下文超 ... · 2 天前 |
![]() |
爱可可-爱生活 · 本文通过提出一种新的可微分特沃斯基相似性度量 ... · 2 天前 |
![]() |
宝玉xp · 以后顾老师再用个AI帮你检查这事//@高飞:👉 //@营养师顾-20250618215403 22 小时前 |
|
新智元 · 首个高考数学满分AI诞生!海淀名师审大题,给出惊艳超高分 2 天前 |
|
AI科技大本营 · MiniMax重磅开源M1模型:百万上下文超DeepSeek R1,实现性能与效率双杀 2 天前 |
|
AI科技大本营 · MiniMax重磅开源M1模型:百万上下文超DeepSeek R1,实现性能与效率双杀 2 天前 |
![]() |
爱可可-爱生活 · 本文通过提出一种新的可微分特沃斯基相似性度量方法,并构建了基于此-20250617054209 2 天前 |
|
奥斯CAR · 一周车事:比途观颜值更高的德系SUV来了 8 年前 |
|
正和岛 · 世界已经严重失衡,社群型企业靠谱吗? 8 年前 |
|
全球健身指南 · 终极一体化全身训练,快速增加新陈代谢! 8 年前 |
|
董明珠自媒体 · 大咖“董粉”上线!《人民的名义》作者兼编剧周梅森 8 年前 |
|
腾讯自选股财经 · A股现兜底式增持潮 是大股东“阳谋”? 8 年前 |