专栏名称: Momenta
世界顶尖自动驾驶团队,致力于打造最强无人车大脑。
目录
相关文章推荐
文明内蒙古  ·  名单公布!内蒙古上榜的是→ ·  13 小时前  
晋江文学城  ·  限时免费 · 现言 丨《错婚》 ·  昨天  
晋江文学城  ·  限时免费 · 现言 丨《错婚》 ·  昨天  
51好读  ›  专栏  ›  Momenta

CVPR | Deep Layer Cascade论文解读

Momenta  · 公众号  ·  · 2017-08-03 17:59

正文

请到「今天看啥」查看全文


Cascade是常用的一种ensemble model的方法,最为人熟知的应用当属在人脸检测中的应用了。


通常cascade是将若干个子模型整合成在一起,是模型层面的整合。本文的贡献是将cascade结构引入了网络结构内部,构造了Deep Layer Cascade (LC) ,来分阶段处理分割任务中不同难度的位置。


文章中称,在分割任务中,一张图像的像素不该平等对待。这点也符合我们的直觉,在分割任务中,物体内部的大片区域是较容易分类正确的,而边界轮廓上位置的像素相比之下更难区分。


如下图所示,红色表示的困难像素在图像中所占的比例很小,并且多数集中在物体的边界部分(也存在相当多的标注错误)。

通常我们用FCN方法训练模型时,为了更好的预测边界位置等困难像素,可以在训练过程中通过hard negative mining等操作来增加边界上困难样本的权重,使模型在训练的过程中对困难像素更加的重视。这是一种隐式的调整图像中像素权重的方式。


本文将cascade的思想显示的应用到了网络结构中,在网络结构中直接构造出来了不同的等级阶段。文章将图像中的像素分为简单、中等、困难三个等级。在一个模型里,分出三个阶段代表不同等级的难度。上一个阶段置信度低的预测位置,其特征会传入下一个阶段来再次预测;而置信度高的预测位置,其特征则不再向后传递。







请到「今天看啥」查看全文