本论文深入研究了双目立体视觉的特征匹配问题。双目立体视觉系统在工业测量、机器人感知、手术导航等方面有着非常广泛的应用。近年来,基于端到端卷积神经网络的深度立体匹配网络已取得远超传统方法的显著性能提升。然而,最新的算法框架仍然难以在无纹理区域、微小结构、小物体和近边界处找到正确的特征对应。而通过边缘、轮廓等底层视觉线索及其相应的几何约束,问题的病态性可以得到很大缓解。因此,为了提高视差估计质量,本文提出了一个有效的多任务学习网络EdgeStereo,该网络由视差估计分支和边缘检测分支组成,可以同时对视差图和边缘进行端到端的估计,把边缘检测和视差计算整合到一个网络中处理。结果表明,基于该统一模型,边缘检测任务和立体匹配任务可以互相提升、相得益彰。此外,论文还设计了一个紧凑的残差金字塔模块,以取代当前立体匹配网络中常用的多级级联结构或基于3D卷积的正则化模块。EdgeStereo在FlyingThings3D数据集,KITTI 2012和KITTI 2015立体基准测试上取得了领先的性能,成为众多论文的参考基准。本工作的会议论文版曾获ACCV2018最佳论文提名奖。
![20200512_052506_979.png 图片 1.png](https://news.sjtu.edu.cn/resource/upload/202005/20200512_052506_979.png)
论文链接:https://doi.org/10.1007/s11263-019-01287-w