专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
新浪科技  ·  【#任天堂JoyCon2未使用霍尔效应摇杆# ... ·  17 小时前  
新浪科技  ·  【#腾讯回应首个满级QQ诞生##首个满级QQ ... ·  17 小时前  
腾讯科技  ·  图灵奖得主Richard S. ... ·  昨天  
36氪  ·  张雪峰含泪赚了几个亿 ·  2 天前  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250212

腾讯研究院  · 公众号  · 科技媒体  · 2025-02-12 00:01

正文

请到「今天看啥」查看全文


三、  DeepSeek-R1+Cursor,7大国产算力上部署的API服务

1. 无问芯穹平台上线满血版DeepSeek-R1、V3的API服务,支持无邀请免费Token试用,并提供多规格企业级并发服务包;

2. 该平台已完成DeepSeek-R1在壁仞、海光等7家国产芯片平台的部署与推理服务适配,支持一键获取模型和算力;

3. 平台提供OpenAI兼容的API接口,可通过Cursor IDE进行集成开发,支持私有化部署等企业级服务。

https://mp.weixin.qq.com/s/cEmB9NdC3u5iEHC60PBJrw

四、  Open R1 开源项目称将补齐 DeepSeek-R1未公开技术细节

1. Hugging Face的Open R1项目发布22万条数据集OpenR1-Math-220k,通过DeepSeek R1生成并经过筛选验证,实现对其训练数据的复现;

2. 团队使用512个H100芯片本地运行,采用vLLM和SGLang工具,每天可生成18万条推理轨迹,大幅提升生成效率;

3. 基于该数据集训练的Qwen-7B-Math-Instruct模型,性能已达到DeepSeek-Distill-Qwen-7B的相当水平。







请到「今天看啥」查看全文