位置:成果数据库 > 期刊 > 期刊详情页
一种鲁棒的约束物体检测和语义分割类别一致性的高阶能量项
  • ISSN号:1003-9775
  • 期刊名称:《计算机辅助设计与图形学学报》
  • 时间:0
  • 分类:TP391.41[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院自动化研究所模式识别国家重点实验室,北京100190, [2]中原工学院电子信息学院,郑州450007
  • 相关基金:国家自然科学基金(61333015,61273280).
中文摘要:

在统一的能量优化框架下同时进行物体检测和语义分割是一种有效的完整场景理解方式,其中如何设计合适的高阶能量项并对其进行有效求解是2个关键问题.文中给出了对物体检测和语义分割之间的类别一致性进行有效建模的高阶能量项的3条设计准则,并据此给出一种鲁棒的高阶能量项及其对应的高效能量优化算法.首先对正确、错误的以及定位不准的3类物体检测器的限界框中的类别一致性分别进行建模,并表示为3个线性函数的下包络形式;然后证明了在?-expansion下仅需添加2个辅助变量即可通过图割算法对该高阶能量项进行高效求解.在PASCAL VOC 2010数据集上与多个代表性算法进行对比的实验结果表明,文中提出的高阶能量项模型在接受和拒绝物体检测器时,均能有效地约束物体检测和语义分割之间的一致性,且对定位不准的物体检测器具有鲁棒性.

英文摘要:

Jointly solving the object detection and semantic segmentation under a unified energy minimization framework is a promising way towards a holistic scene understanding, in which how to design powerful expressive higher order potentials and how to construct the corresponding efficient inference algorithms are two key issues. In this work, we at first introduce three design criteria for suitable higher order potential to appropriately model label consistency between object detection and semantic segmentation, then based on these three criteria, a robust higher order potential and its corresponding efficient inference algorithm are proposed. Our proposed higher order potential separately models the label consistency of the pixels within the bounding boxes for true, false and inaccurate detectors, and can be represented as the lower envelope of three linear functions. By introducing only two auxiliary binary variables, it is proved the higher order ?-expansion move function can be transformed to submodular pairwise energy, which in turn can be efficiently minimized via graph cuts. The comparative experiments on PASCAL VOC 2010 dataset with the state-of-the-art algorithms showed that our proposed robust higher order potential could effectively model the label consistency of object detection and semantic segmentation for both accepted and rejected detectors, while keeping robust to the false detectors resulting from inaccurate localization.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机辅助设计与图形学学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国计算机学会
  • 主编:鲍虎军
  • 地址:北京2704信箱
  • 邮编:100190
  • 邮箱:jcad@ict.ac.cn
  • 电话:010-62562491
  • 国际标准刊号:ISSN:1003-9775
  • 国内统一刊号:ISSN:11-2925/TP
  • 邮发代号:82-456
  • 获奖情况:
  • 第三届国家期刊奖提名奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:24752