位置:成果数据库 > 期刊 > 期刊详情页
张量核范数回归的目标跟踪
  • ISSN号:1006-8961
  • 期刊名称:《中国图象图形学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]新疆大学机械工程学院,乌鲁木齐830046, [2]南京理工大学计算机科学与工程学院,南京210094
  • 相关基金:国家自然科学基金项目(51365052,61272220)
中文摘要:

目的视觉目标跟踪中,不同时刻的目标状态是利用在线学习的模板数据线性组合近似表示。由于跟踪中目标受到自身或场景中各种复杂干扰因素的影响,跟踪器的建模能力很大程度地依赖模板数据的概括性及其误差的估计精度。很多现有算法以向量形式表示样本信号,而改变其原始数据结构,使得样本数据各元素之间原有的自然关系受到严重破坏;此外,这种数据表述机制会提高数据的维度,而带来一定的计算复杂度和资源浪费。本文以多线性分析的角度更进一步深入研究视频跟踪中的数据表示及其建模机制,为其提供更加紧凑有效的解决方法。方法本文跟踪框架中,候选样本及其重构信号以张量形式表示,从而保证其数据的原始结构。跟踪器输出候选样本外观状态时,以张量良好的多线性特性来组织跟踪系统的建模任务,利用张量核范数及L,范数正则化其目标函数的相关成分,在多任务状态学习假设下充分挖掘各候选样本外观表示任务的独立性及相互依赖关系。结果用结构化张量表示的数据原型及其多任务观测模型能够较为有效地解决跟踪系统的数据表示及计算复杂度难题。同时,为候选样本外观模型的多任务联合学习提供更加简便有效的解决途径。这样,当跟踪器遇到破坏性较强的噪声干扰时,其张量核范数约束的误差估计机制在多任务联合学习框架下更加充分挖掘目标全面信息,使其更好地适应内在或外在因素所引起的视觉信息变化。在一些公认测试视频上的实验结果表明,本文算法在候选样本外观模型表示方面表现出更为鲁棒的性能。因而和一些优秀的同类算法相比,本文算法在各测试序列中跟踪到的目标图像块平均中心位置误差和平均重叠率分别达到4.2和0.82,体现出更好的跟踪精度。结论大量实验验证本文?

英文摘要:

Objective In visual object tracking, the state of the target in every video frame is linearly represented using sev- eral online learned templates. The modeling ability of the tracker greatly depends on the generalizability of the template data and its error estimation precision because of the complex interference factors that are caused by the target itself or the scenes. Many existing algorithms have been used to represent the samples in vector form and to change factitiously the original data structure such that the natural relationship between each data pixel of a sample is extremely damaged. In addition, such data expression mechanism may enlarge the data dimensionality that significantly intensifies the computational com- plexity and wastes much resources. This paper investigates the data representation and observation modeling mechanism of the video tracking framework and provides a more compact and effective solution based on muhilinear analysis. Method In our framework, the candidate samples and their reconstructed signals are expressed in tensor form to maintain the original structure of the data. When the tracker outputs the candidate appearance models, the modeling tasks of the tracking system are organized using the excellent muhilinear characteristics of the tensor structures. The objective function is regularized u- sing the tensor nuclear norm and the L1 norm in order to excavate fully the independences and interdependences of the ob- servation models with a muhitask state learning assumption. Result The structured tensor form used in the data prototypes and observation models can effectively address the data representation problems and computational complexities in the track- ing system. This form also provides a more simple and effective solution for the muhitask joint learning of the candidate ap- pearance models. When the tracker meets any destructive noise interferences, its tensor nuclear norm constraint mechanism of error estimation in a muhitask joint learning framework fully excavates the

同期刊论文项目
同项目期刊论文
期刊信息
  • 《数码影像》
  • 主管单位:
  • 主办单位:中国图象图形学学会 中科院遥感所 北京应用物理与计算数学研究所
  • 主编:
  • 地址:北京市海淀区花园路6号
  • 邮编:100088
  • 邮箱:
  • 电话:010-86211360 62378784
  • 国际标准刊号:ISSN:1006-8961
  • 国内统一刊号:ISSN:11-3758/TB
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:0