|
【CMU博士论文】面向求真、复杂推理与人类价值的大规模语言模型可扩展对齐 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
原创|DeepSeek动态知识更新——以DeepSeek-R1为例 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
【WWW2025教程】人工智能在复杂网络中的应用:潜力、方法与应用 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
第二届开源技术学术大会征稿通知 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
Chaos:数据驱动的复杂系统建模特刊概览 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
Hybrid-RRF:动态权重混合检索RAG方案 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
【NYU博士论文】神经网络中的简单结构:论表达能力、优化性与数据分布 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
科普之旅|解锁DeepSeek实用技能,让AI为你所用 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
覆盖40+主流模型及数据集,上海交大团队发布一站式蛋白质工程设计平台VenusFactory,一键部... 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
数据派志愿者招募 | 寻找最志同道合的你! 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
原创|大模型分布式训练中的关键技术:数据并行(二) 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
ICLR 2025 | 精度近乎无损!首个Mamba系列模型量化方案MambaQuant 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
【CMU博士论文】语境:表征学习的机制 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
如何去掉GRPO的长度bias?Sea AI Lab提出全新优化方法,有效提升令牌效率和推理性能 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
【博士论文】物体学习与鲁棒的三维重建 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
用离散标记重塑人体姿态:VQ-VAE实现关键点组合关系编码 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
最大化挖掘临床MRI数据价值,UCL团队提出MindGlide模型,实现多发性硬化症病变量化 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
深度学习的平衡之道:港科大、港城大等团队联合发布多目标优化最新综述 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
【SIGIR2025】在缺失模态场景中解耦与生成推荐模态 数据派THU · 公众号 · 大数据 · 3 周前 · |
|
|
强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展 数据派THU · 公众号 · 大数据 · 4 周前 · |
|