专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
目录
相关文章推荐
老刘说NLP  ·  48个流行开源ML数据集及KG三元组抽取工具 ... ·  2 天前  
程序员技术  ·  前美团员工求助:在美团背了个C绩效,慌得不行 ... ·  21 小时前  
大淘宝技术  ·  大模型微调知识与实践分享 ·  昨天  
极客之家  ·  22k star,微软硬核开源,让 ... ·  3 天前  
51好读  ›  专栏  ›  OSC开源社区

继V3之后,沐曦GPU再完成DeepSeek-R1全尺寸适配,已上线Gitee AI

OSC开源社区  · 公众号  · 程序员  · 2025-02-07 15:11

正文

请到「今天看啥」查看全文


三大「杀手锏」成就国产模型新高度

DeepSeek-R1 的性能相信大家已经充分领教了,其「杀手锏」之一就是 开放了思维链输出过程 ,用户可以看到模型进行推理时的每一步逻辑,告别了传统大模型的「黑盒」问题。

Gitee AI 中 DeepSeek-R1 的推理过程

DeepSeek-R1 另一个「杀手锏」则是在后训练阶段大规模使用了强化学习技术, 在仅有极少标注数据的情况下,极大提升了模型推理能力 。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI-o1 正式版。

DeepSeek-R1 的第三个「杀手锏」无疑是开放的许可证和用户协议,模型开源 License 统一使用 MIT, 完全开源,不限制商用,无需申请







请到「今天看啥」查看全文