最近研究表明,机器学习中的多任务学习有利于克服目标识别中的多视角和遮掩等问题。多任务学习通过共享相关任务的内在关键信息,使得各个任务在有限样本情况下,学习出比单任务体系更鲁棒的模型。在计算机视觉尤其是视频监控中提取的目标信息往往是高维的,因此数据降维又是很重要的一环。然而,要在数据降维的同时实现灵活和有效的多任务学习,仍有许多开放性问题有待深入研究。本课题拟在理论上深入开展多任务降维子空间的研究,包括在多种不同情形下建立多任务降维子空间模型、利用降维子空间方法实现相关任务间共享信息与任务间差异信息的协同建模、研究不同任务的相关性对多任务降维子空间学习的影响、以及研究适合多任务学习的特征表达。在理论研究基础上,我们把多任务降维子空间应用于视频监控下的目标识别,主要侧重于行人再标识的研究并发展相应的多任务降维子空间排序模型。本研究将丰富多任务和子空间学习理论,并促进行人再标识研究的深入发展。
multi-task learning;subspace learning;person re-identification;object detection and recognition;action recognition
在本项目支持下,主要研究了在视频监控下的利用多任务子空间建模相关的行人和物体识别,包括行人再标识、行人检测和物体检测、行为识别及相关的人脸识别等。在过去的3年中,主要取得如下成绩1)发展基于相对比较的行人再标识算法,并通过发展相关多任务学习扩展,实现从无类标行人数据迁移有用的鉴别信息,发展出行人验证模型;2)发展多任务特征量化方法,以实现迁移其它相关非目标物体的语境信息到目标类的物体上,极大增强目标类的语境信息学习模型;3)发展多任务排序分类器学习,选取有利于鉴别行人与物体交互行为的独特鉴别特征;4)发展相关的大规模搜索和聚类技术。此外,我们在研究的过程中考虑一些相关的迁移和子空间的人脸识别算法。研究项目总体进展顺利,部分研究仍在开展中,部分成果仍在投稿中。共发表论文/论著20篇,其中IEEE Transaction 6篇,Pattern Recognition 1篇,Neural Networks 2篇,国际顶级会议论文5篇,有一篇论文为ESI高被引论文。