专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
新浪科技  ·  【午评:#有色金属板块涨幅居前#】#金陵体育 ... ·  18 小时前  
新浪科技  ·  【#曝iOS26适配iPhone11及更新机 ... ·  昨天  
新浪科技  ·  【#曝尊界S800大定均价破100万元#】博 ... ·  2 天前  
腾讯研究院  ·  腾讯研究院AI速递 20250605 ·  2 天前  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250311

腾讯研究院  · 公众号  · 科技媒体  · 2025-03-11 00:02

正文

请到「今天看啥」查看全文


1. 微软开源多模态AI基础模型Magma,能在环境中理解多模态输入并与实际情况联系,已被CVPR接收,支持网页导航和机器人操作;

2. Magma创新性提出Set-of-Mark和Trace-of-Mark两大标注方法,前者为关键对象提供高层次"关注标记",后者捕捉动作时序变化;

3. 模型由3900多万条样本预训练,采用ConvNeXt-XXL视觉网络和Llama-3-8B语言模型,团队大部分为华人,一作杨健伟为微软资深研究员。

https://mp.weixin.qq.com/s/ghcGqhF65yP19ze4_luiAw

四、  稚晖君预告揭晓!智元发布首个通用具身基座模型GO-1

1. 智元机器人发布全新ViLLA架构和GO-1通用具身基座模型,解决机器人"看得懂做不来"的难题,可直接利用人类操作视频转化为可执行动作;

2. ViLLA架构通过Latent Action Tokens预测隐式动作,结合VLM和MoE专家模型,打通认知与动作两个维度,实现四级训练数据的综合利用;

3. GO-1基座模型在五种复杂度任务测试中成功率达78%,比现有最优模型提高32%,具备人类视频学习、小样本泛化、一脑多形和持续进化四大突破能力。

https://mp.weixin.qq.com/s/pErwkCKNeuEvimrAfKcbWA

五、  「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10







请到「今天看啥」查看全文