专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
新浪科技  ·  【#阿里针对苹果框架推出AI模型#】阿里巴巴 ... ·  13 小时前  
新浪科技  ·  【#VisionPro专用空间追踪笔#】在苹 ... ·  3 天前  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250514

腾讯研究院  · 公众号  · 科技媒体  · 2025-05-14 00:01

正文

请到「今天看啥」查看全文


三、 昆仑万维开源Matrix-Game,单图打造游戏世界 宇宙

1. Matrix-Game是昆仑万维开源的首个10B+交互式世界基础模型,能根据用户输入生成连贯可控的游戏互动视频,在视觉质量、物理一致性等方面超越现有开源模型;

2. 模型通过两阶段训练(无标签预训练+标注数据可控训练)和Matrix-Game-MC数据集训练,结合独特的图像到世界建模架构,实现了高精度的动作响应和场景泛化;

3. 这代表空间智能领域的重要突破,不仅适用于游戏开发,还可与天工、Mureka等AI产品联动,推动影视、广告、XR等领域的内容生产革新。

https://mp.weixin.qq.com/s/ZuuRT84HQn8pKtaz_oX9qw

四、 腾讯发布首个多模态统一CoT奖励模型,奖励能力大幅跃升

1. 腾讯混元联合多家机构推出UnifiedReward-Think,首次实现具备长链式推理能力的统一多模态奖励模型,通过三阶段训练(冷启动激发、拒绝采样巩固、GRPO强化)提升评估能力;

2. 该模型解决了现有奖励模型只能"表面判断"的问题,展现出显式和隐式推理能力,在图像生成和理解任务中性能显著提升,同时保持高可解释性;

3. UnifiedReward-Think已全面开源,包含模型、数据集和工具,代表奖励模型从简单"打分器"向具备认知理解的智能评估系统转变。







请到「今天看啥」查看全文