|
从YOLOv5到YOLO11!改进有多大? 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
字节跳动提出Mogao模型:开启 AIGC 从“能写会画”到“边写边画” 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
T-Rex Label 上线 DINO-X 模型预标注,52CV 粉丝专属福利来袭 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
KuaiMod | 更高准确率、超低举报率的工业级自动化短视频质量判别框架 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
为何说 “在国内做科研,最忌讳踏实”? 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
ICML 2025 | 加州伯克利和 MIT 提出 Sparse VideoGen,挖掘模型稀疏性,... 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
TPAMI 2025 | 更快、更灵活的 Transformer图像复原网络 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
Aero-1-Audio: LMMs-Lab发布1.5B音频语言模型,长音频转录直出,性能优异! 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
Video-XL-Pro:端侧3B模型长视频理解新sota!性能赶超7B巨头! 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
蚂蚁集团全球招募顶尖AI人才 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
CVPR25 | CV 微调卷出天际,Mona:我小,我强,我省资源 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
专刊征稿:面向机器人持续感知的具身多模态数据融合 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
TMI 2025 | 最新医疗图像分割模型:Zig-RiR,精准分割二维、三维医疗图像 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
【人工智能 · 5月热门会议都在这里】优质会议合集,往届均已完成检索! 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
ICLR2025 | 打破次元壁!同济提出FaceShot,让表情包、玩具也能“开口说话”! 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
UniToken:为统一多模态理解与生成打造信息完备的视觉表征 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
自回归的捍卫者来了:复旦联手字节Seed开源纯AR图像生成模型 我爱计算机视觉 · 公众号 · · 1 月前 · |
|
|
解锁 AI 开发新高度:AI 工作站与 NVIDIA AI Workbench 全栈解决方案 我爱计算机视觉 · 公众号 · · 2 月前 · |
|
|
斩获GitHub2.2k星!腾讯优图联合南京大学开源实时视频-语音交互大模型VITA-1.5 我爱计算机视觉 · 公众号 · · 2 月前 · |
|
|
IJCAI 2025 深度伪造检测、定位、可解释性研讨会暨挑战赛正式启动! 我爱计算机视觉 · 公众号 · · 2 月前 · |
|