东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

融合视音频特征的影片摘要生成方法

ISSN号：1001-3695
期刊名称：《计算机应用研究》
时间：0
分类：TP391.4[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]长沙学院数学与计算机科学系,长沙410022, [2]国防科学技术大学信息系统与管理学院,长沙410073
相关基金：国家自然科学基金资助项目（61571453）;湖南省自然科学基金资助项目（14JJ3010）;湖南省教育厅重点资助项目（15A020）

关键词：视频摘要, 人脸检测, 端点检测, 视音频特征融合, video summarization, face detection, endpoint detection, audio-visual feature fusion

中文摘要：

提出了融合视音频特征的影片摘要生成算法。以特写人脸检测,紧张、激烈镜头检测作为选取重要视频片段的依据,针对影片语音端点难以检测的问题,利用影片字幕文件提取影片语音首尾时间以及语音内容,从而实现了影片语音端点的准确检测。实验证明,该方法生成的影片摘要具有较好的有效性。

英文摘要：

Abstract ： This paper proposed a movie summarization method based on audio-visual feature fusion. This method selected video clips which had close-up faces and atwitter shots as the important clips. To solve the problem of difficulty in movie speech endpoint detection, it introduced a method of speech endpoint detection based on subtitles of motion pictures, which could detect the start and end time of captions exactly. Compared with other summarization algorithms, the proposed method is proved to be effective for movie summarization.

同期刊论文项目

视频内容重复检测及关联分析技术研究

期刊论文 5

同项目期刊论文

基于领域相似度的复杂网络节点重要度评估算法

一种基于层次分析法的视频摘要评价模型

多路段元胞自动机交通流模型

基于深度认知神经网络的跨媒体情报大数据智能处理技术

期刊信息

《计算机应用研究》
北大核心期刊（2011版）

主管单位:四川省科学技术厅
主办单位:四川省计算机研究院
主编：刘营
地址：成都市成科西路3号
邮编：610041
邮箱：arocmag@163.com
电话：028-85210177 85249567

国际标准刊号：ISSN：1001-3695
国内统一刊号：ISSN：51-1196/TP
邮发代号:62-68

获奖情况:
第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:60049