专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

腾讯研究院AI速递 20250410

腾讯研究院 · 公众号 · 科技媒体 · 2025-04-10 00:01

正文

1.英伟达开源Llama Nemotron-253B模型超越Llama 4，在数学编码、科学问答中准确率登顶，仅用一半参数媲美DeepSeek R1，吞吐量提升4倍；

2.模型采用"测试时Scaling"技术，通过系统提示词控制推理模式开关，在模型推理阶段投入更多计算资源提升响应质量；

3.Llama Nemotron系列包括Nano(8B)、Super(49B)和Ultra(253B)三种规模，基于Llama构建并采用英伟达审核后的数据集，全部可商用。

四、UC伯克利开源DeepCoder 14B「o3-mini」，代码版R1突袭

1.UC伯克利和Together AI联合推出开源代码推理模型DeepCoder-14B-Preview，仅14B参数就媲美OpenAI o3-mini，LiveCodeBench通过率达60.6%；

2.模型基于Deepseek-R1-Distilled-Qwen-14B微调，采用高质量24K编程问题数据集和GRPO+算法训练，支持64K上下文长度；

3.团队开源了verl-pipe训练系统，通过一次性流水线化技术将端到端训练速度提高2倍，实现训练、奖励计算和采样的完全并行处理。

五、亚马逊新AI语音模型Nova Sonic，捕捉语气、语调变化和节奏

1.亚马逊推出Nova Sonic语音基础模型，将语音理解和生成功能集成到单一模型中，能够理解语气、风格和节奏等语音语境；