东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

一种基于音频词袋的暴力视频分类方法

期刊名称：上海交通大学学报(自然版)
时间：0
页码：214-218
语言：中文
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]上海交通大学信息安全工程学院,上海200240, [2]上海市信息安全综合管理技术研究重点实验室,上海200240
相关基金：国家自然科学基金项目（61071153 60802057）; 上海市青年科技启明星计划项目（10QA1403700）
相关项目：基于特征分析的数字视频鉴定技术研究

作者：孙锬锋|李荣杰|蒋兴浩|

关键词：暴力视频, 音频词袋, 权重机制, 支持向量机, violent videos, bag of audio words, weighting scheme, support vector machine

中文摘要：

针对网络视频的监管需求,提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口（MPEG-7）音频特征（包括音频频谱质心,音频频谱带宽等低层音频特征.）及MPEG-7高层特征——音频签名,来构造每段视频特有的音频词汇,采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中,对于不同音频词汇量采用了独特的词汇权重分配机制,同时借助特有的针对暴力视频的分类策略,以提高分类效果.通过3组实验,对不同的音频特征的准确率、不同词汇的分类效果、以及对视觉特征粗分类的精确分类进行了研究.实验结果表明,该方法有较好的查全率.

英文摘要：

A new method to classify the violent videos by the bag of audio words was introduced.The MPEG-7 audio descriptors are firstly extracted,including the low level features such as AudioSpectrumCentroid and AudioSpectrumSpread etc.After that,the audio words are built through the MPEG-7 high level descriptor,the AudioSighnature,which is considered as the fingerprint of the audio stream.The support vector machine is used to classify the feature vectors into two genres,which are the violent and non-violent.There are three experiments in this paper： the research on the different types of the audio words,the different size of words and the classification of the shots detected from the visual features.It is demonstrated from the experiment result that the proposed method achieves good recall accuracy.

同期刊论文项目

基于微词汇语义与时空、音频特征融合的视频内容分类算法研究

期刊论文 16 会议论文 8 专利 3

　面向互联网内容管控的不良视频分析方法研究

期刊论文 9

基于特征分析的数字视频鉴定技术研究

期刊论文 25 会议论文 3 专利 1

同项目期刊论文

An Adaptive Video Shot Segmentation Scheme Based on Dual-detection Model

Detection of Double Compression in MPEG-4 Videos Based on Markov Statistics

A Video Content Classification Algorithm Applying to Human Action Recognition

基于首位数字特征的双重MPEG压缩检测算法

基于改进稀疏编码模型的图像分类算法

Multi-Scale Image Semantic Recognition with Hierarchical Visual Vocabulary

A Novel Video Content Classification Algorithm Based on Combined Visual Features Model

基于语义绑定的分层视觉词汇库的图像检索

Human Action Recognition Based on Oriented Gradient Histogram of Slide Blocks on Spatio-Temporal Sil

压缩域视频水印的失真漂移补偿算法

一种基于空-时快速鲁棒特征的视频词汇的人行为识别方法

基于稀疏编码和多核学习的图像分类算法

An H.264/AVC Video Watermarking Scheme in VLC Domain for Content Authentication

基于VLC域的H.264/AVC视频流内容级认证水印算法

基于双重检测模型的视频镜头分割算法

基于改进稀疏编码模型的图像分类算法

基于H.264/AVC的VLC域的视频水印内容认证计划

基于动态学习的视频镜头边界检测阈值设定算法

基于一对一支持向量机的视频自动分类算法

一种鲁棒自适应差分能量视频水印算法

基于融合MPEG-7描述子和二次预测机制的视频自动分类算法

基于有限状态机模型的非压缩域视频差分能量水印算法

一种自适应的基于双检测模型的视频镜头分割算法

一种新的自适应差分能量视频水印在版权保护方案

基于特征融合策略的视频内容理解方案

基于联合视觉特征模型的视频内容分类算法

基于分层词汇的多尺度图像语义识别

一种基于空_时快速鲁棒特征的视频词汇的人行为识别方法

基于可变窗的镜头边界检测算法

双因子自适应阈值的镜头边界检测算法

基于像素能量分布的自适应差分能量水印算法

基于语义绑定的分层视觉词汇库的图像检索

压缩域视频水印的失真漂移补偿算法

一种基于空-时快速鲁棒特征的视频词汇的人行为识别方法

An H.264/AVC Video Watermarking Scheme in VLC Domain for Content Authentication

基于VLC域的H.264/AVC视频流内容级认证水印算法

基于双重检测模型的视频镜头分割算法

基于首位数字特征的双重MPEG压缩检测算法

基于融合MPEG-7描述子和二次预测机制的视频自动分类算法

基于语义绑定的分层视觉词汇库的图像检索

压缩域视频水印的失真漂移补偿算法

一种基于空-时快速鲁棒特征的视频词汇的人行为识别方法

An H.264/AVC Video Watermarking Scheme in VLC Domain for Content Authentication

基于VLC域的H.264/AVC视频流内容级认证水印算法

基于双重检测模型的视频镜头分割算法