位置:成果数据库 > 期刊 > 期刊详情页
基于用户关注空间与注意力分析的视频精彩摘要与排序
  • ISSN号:0254-4164
  • 期刊名称:计算机学报
  • 时间:0
  • 页码:1612-1621
  • 语言:中文
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学院研究生院,北京100190, [2]中国科学院计算技术研究所,北京100190, [3]中国科学院智能信息处理重点实验室,北京100190, [4]北京大学信息科学与技术学院,北京100871
  • 相关基金:本课题得到国家“八六三”高技术研究发展计划项目基金(2006AA012117)和国家自然科学基金(60773136,60702035)资助.
  • 相关项目:基于自适应特征的复杂背景下目标检测与跟踪方法研究
作者: 黄庆明等|
中文摘要:

文中提出一种基于用户关注空间与注意力分析的视频内容理解方法,该方法可以有效地获得多通道的视频关注信息,并可使用户根据个性化需求定制视频关注内容,实现视频的高效浏览与访问。首先采用基于二叉层次型结构与分类器选择的音频分类算法将视频中的主要声音类型分类,然后将视频中影响用户注意力的视觉、听觉、时序因素定义为用户关注空间,分别使用相应的中层特征在这三个方面对用户注意力进行表示并计算其关注度,从而在音视频底层特征与高层认知之间建立有机过渡。作者设计了顺序决策融合算法来融合视觉与听觉关注度,生成关注度时序变化曲线并获得精彩摘要。最后使用支持向量回归模型并引入相关反馈机制来实现用户个性化的精彩片段排序。该项工作的特点是通过建立符合人类认知规律的关注度模型并结合相关反馈技术,对视频内容进行类人理解。实验证明,该方法对提取与生成符合用户个性化要求的视频摘要及排序结果具有良好的效果。

英文摘要:

This paper proposes a user attention analysis based video content understanding approach, which can be used to automatically detect the highlights of videos and rank them according to their impressive values. Firstly, audio classification is done using the authorsr hierarchical bintree framework and classifier selection algorithm. Then, the user attention space is established and the visual, aural, temporal mid-level features are extracted to represent the three main mo- dalities of this space, and the attention values are calculated correspondingly. A specific fusion strategy called ordinal-decision is used to combine the visual, aural attention models and form the attention curve for a video. The highlight segments can be extracted from this attention curve. Finally, the support vector regression model and relevance feedback mechanism are employed to rank the highlight segments and make the ranking result more suitable for human personalization. The method that introduces the user attention into the video content analysis field could effectively generate the summaries and rank them according to their impressive values. The proposed approach is based on the changes of human attention while watching videos rather than the simple content changes of them, which is more consistent with human understanding. Experimental results demonstrate that the proposed approach is effective for video summarization and highlight ranking.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433