专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250410

腾讯研究院  · 公众号  · 科技媒体  · 2025-04-10 00:01

正文

请到「今天看啥」查看全文


1.英伟达开源Llama Nemotron-253B模型超越Llama 4,在数学编码、科学问答中准确率登顶,仅用一半参数媲美DeepSeek R1,吞吐量提升4倍;

2.模型采用"测试时Scaling"技术,通过系统提示词控制推理模式开关,在模型推理阶段投入更多计算资源提升响应质量;

3.Llama Nemotron系列包括Nano(8B)、Super(49B)和Ultra(253B)三种规模,基于Llama构建并采用英伟达审核后的数据集,全部可商用。

https://mp.weixin.qq.com/s/QbUTBKG9vrIVTA-6qII2gg

四、UC伯克利开源DeepCoder  14B「o3-mini」,代码版R1突袭

1.UC伯克利和Together AI联合推出开源代码推理模型DeepCoder-14B-Preview,仅14B参数就媲美OpenAI o3-mini,LiveCodeBench通过率达60.6%;

2.模型基于Deepseek-R1-Distilled-Qwen-14B微调,采用高质量24K编程问题数据集和GRPO+算法训练,支持64K上下文长度;

3.团队开源了verl-pipe训练系统,通过一次性流水线化技术将端到端训练速度提高2倍,实现训练、奖励计算和采样的完全并行处理。

https://mp.weixin.qq.com/s/VxGofHl_KeuQa9MBD4AaTg

五、亚马逊新AI语音模型Nova Sonic,捕捉语气、语调变化和节奏

1.亚马逊推出Nova Sonic语音基础模型,将语音理解和生成功能集成到单一模型中,能够理解语气、风格和节奏等语音语境;







请到「今天看啥」查看全文


推荐文章
十点读书  ·  穷养男孩,真的好吗?
8 年前
巨蟹座专属  ·  巨蟹座能否接受一段暧昧关系
8 年前
24小时全球守望祷告中心  ·  埃及大巴遭袭已致28死数十人伤 三名凶手仍在逃
8 年前