专栏名称: GIS研发
GIS研发团队,聚焦科技创新、软件研发及优秀人才培养,攻克视频GIS、GeoAI、GIS开发及应用领域的关键技术问题。
目录
相关文章推荐
马靖昊说会计  ·  跳出财报 ·  13 小时前  
会计雅苑  ·  限价119万!要求派出至少50人,其中CPA ... ·  昨天  
哔哩哔哩  ·  起猛了,看见双头人了 ·  2 天前  
哔哩哔哩  ·  B站2025毕业歌发布,给最棒的你们! ·  2 天前  
51好读  ›  专栏  ›  GIS研发

【CVPR 2025 Award Candidates】MegaSAM:任意动态视频 SfM 系统

GIS研发  · 公众号  ·  · 2025-06-11 22:43

正文

请到「今天看啥」查看全文


https://arxiv.org/abs/2403.18913)。其中相对深度一般用 disparity 来表示(depth 的倒数),相比于绝对深度 少了 scale 和 shift :depth = a / disparity + b
    • DROID-SLAM: 经典的 Learning-based SLAM 工作,基于同一作者提出的 RAFT 的核心思想构建了一套简洁的 SLAM 系统
      (论文: https://arxiv.org/abs/2108.10869)
      • RAFT 是两帧图像间光流估计任务里经典的方案 (论文: https://arxiv.org/abs/2003.12039 ),至今仍是精度有竞争力的工作。最核心的点是把光流估计表示为从初始光流出发用 GRU (RNN 的变体)不断迭代估计光流 residual 来多次更新的任务。这种迭代优化的范式简化了问题,因此达到了较高的精度,像 Diffusion 也可以看做类似的思路
      • DROID-SLAM 本质也是一个预测光流的网络,通过预测两帧间的光流,并加入了一个可微分的 BA 模块(Bundle Adjustment)实现了 SLAM 的功能。具体来说,DROID-SLAM 维护了每一帧的 depth 和 camera pose 作为优化变量,因为在静态场景下 depth + camera pose 可以算出来像素间的光流,网络的作用是从这个光流出发走 RAFT 的方式迭代预测实际的光流,然后从光流反过来作为 BA 模块的约束更新 depth 和 camera pose。
    • CasualSAM: 用 depth 估计网络来作为额外的先验,用两帧光流作为约束,联合优化 depth 网络部分权重、camera pose 和 相机焦距。本文的一作也参与了该工作(论文:







请到「今天看啥」查看全文