专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
新浪科技  ·  【#曝玄戒芯片将覆盖小米高端产品#】#曝小米 ... ·  10 小时前  
新浪科技  ·  #口碑最好的iPhone诞生5年前#【#iP ... ·  16 小时前  
新浪科技  ·  【#蔡崇信出售WNBA球队股权#,估值暴涨3 ... ·  17 小时前  
新浪科技  ·  【#雷军透露小米复盘##雷军三问小米#】@雷 ... ·  21 小时前  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250428

腾讯研究院  · 公众号  · 科技媒体  · 2025-04-28 00:01

主要观点总结

这篇文章主要介绍了关于生成式AI、图像编辑模型、多模态模型、GPT-4o图像能力、AI相机、微软AgentUFO系统、AI在病毒学测试中的应用、全国法院系统首份涉AI知识产权保护文件等相关内容。

关键观点总结

关键观点1: 生成式AI

包括GPT-4o的升级,个性表现提升,可能过度迎合用户;模型生图能力可能削弱等问题。

关键观点2: 图像编辑模型

介绍了阶跃星辰开源的Step1X-Edit图像编辑模型的特点和性能。

关键观点3: 多模态模型DAM

英伟达等机构推出的DAM多模态模型能精准描述图像和视频中的细节,并在多项基准测试中超越现有开源模型。

关键观点4: GPT-4o图像能力

介绍了GPT-4o的图像生成能力在GPTs机器人商店的应用和图像生成机器人的功能。

关键观点5: AI相机

夸克AI超级框发布的新AI相机通过拍照解答问题,涵盖多个场景。

关键观点6: 微软AgentUFO系统

微软升级了开源Agent操作系统UFO²,并与Windows深度集成,实现了自动化任务的效率和成功率提升。

关键观点7: AI在病毒学测试中的应用

介绍了OpenAI o3在病毒学测试中的准确率超越多数人类专家引发的安全担忧。

关键观点8: 全国法院系统首份涉AI知识产权保护文件

广东高院发布了全国首份AI知识产权保护司法文件,涉及AI生成内容的权属认定、责任界定以及垄断行为的规制等内容。


正文

请到「今天看啥」查看全文


https://mp.weixin.qq.com/s/TTqMKe5SnaYwgmPPL_mpew

三、 阶跃星辰开源图像编辑模型Step1X-Edit,一键改图大师

1. 阶跃星辰开源的Step1X-Edit图像编辑模型达到开源SOTA水平,总参数量19B,支持11类高频编辑任务,具备语义解析、身份保持和区域控制三大关键能力;

2. 模型采用MLLM+Diffusion架构,在GEdit-Bench基准测试中全面领先现有开源模型,性能接近GPT-4o;

3. 该模型已在阶跃AI网页端和App上线,可实现文字替换、风格迁移、材质变换等多样化图像编辑功能,训练数据集包含超100万高质量样本。

https://mp.weixin.qq.com/s/qwY8DwS8toWbesoNmhsfsw

四、 英伟达多模态模型DAM 「描述一切」秒变细节狂魔!仅3B

1. 英伟达等机构推出3B参数的DAM多模态模型,通过焦点提示和局部视觉骨干网络两大创新,能精准描述图像和视频中的任意局部细节;

2. DAM采用DLC-SDP半监督流水线解决训练数据瓶颈,通过两阶段策略构建大规模数据集,并提出DLC-Bench基准重新定义评估标准;

3. 模型在多项基准测试中超越现有开源模型,包括GPT-4o,可应用于数据标注、医疗影像等领域,且支持指令控制描述和零样本区域问答。







请到「今天看啥」查看全文