正文
1.英伟达开源Llama Nemotron-253B模型超越Llama 4,在数学编码、科学问答中准确率登顶,仅用一半参数媲美DeepSeek R1,吞吐量提升4倍;
2.模型采用"测试时Scaling"技术,通过系统提示词控制推理模式开关,在模型推理阶段投入更多计算资源提升响应质量;
3.Llama Nemotron系列包括Nano(8B)、Super(49B)和Ultra(253B)三种规模,基于Llama构建并采用英伟达审核后的数据集,全部可商用。
https://mp.weixin.qq.com/s/QbUTBKG9vrIVTA-6qII2gg
四、UC伯克利开源DeepCoder 14B「o3-mini」,代码版R1突袭
1.UC伯克利和Together AI联合推出开源代码推理模型DeepCoder-14B-Preview,仅14B参数就媲美OpenAI o3-mini,LiveCodeBench通过率达60.6%;
2.模型基于Deepseek-R1-Distilled-Qwen-14B微调,采用高质量24K编程问题数据集和GRPO+算法训练,支持64K上下文长度;
3.团队开源了verl-pipe训练系统,通过一次性流水线化技术将端到端训练速度提高2倍,实现训练、奖励计算和采样的完全并行处理。
https://mp.weixin.qq.com/s/VxGofHl_KeuQa9MBD4AaTg
五、亚马逊新AI语音模型Nova Sonic,捕捉语气、语调变化和节奏
1.亚马逊推出Nova Sonic语音基础模型,将语音理解和生成功能集成到单一模型中,能够理解语气、风格和节奏等语音语境;