东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

多层独立子空间分析时空特征的人体行为识别方法

ISSN号：1671-8860
期刊名称：《武汉大学学报：信息科学版》
时间：0
分类：P208[天文地球—地图制图学与地理信息工程;天文地球—测绘科学与技术]
作者机构：[1]武汉大学电子信息学院,湖北武汉430072, [2]厦门大学通信工程系,福建厦门361005
相关基金：国家自然科学基金（61072135）

关键词：卷积叠加, 独立子空间分析, 多层网络, 无监督学习, 深度学习, 人体行为识别, stack and convolution, independent subspace analysis, multi-layer neural network, unsupervised learning, deep learning, human action recognition

中文摘要：

人体行为识别在视频监控、医疗诊断等领域都有重要的意义。目前人体识别的主要方法是将人为设计的二维特征扩展到三维空间,或利用运动轨迹,提取出时空特征。基于深度学习的思想,直接在三维空间中构建多层神经网络,从大量的视频数据中学习不同行为的时空特征。首先,采用独立子空间分析（independent subspace analysis,ISA）方法,构造两层卷积叠加神经网络,从训练视频中学习网络权重。然后,对特征使用K-means聚类,转化为视觉单词,根据视觉单词频率直方图计算支持向量机模型（support vector machine,SVM）判决超平面,最后对待分析视频进行动作分类。使用该方法对Hollywood2数据库的12种行为进行实验,结果表明,ISA学习到的特征权重与Gabor滤波器类似,对图像频率和方向具有明显的选择性,对相位变化具有鲁棒性,能够显著提高认为识别的正确率,符合人眼的视觉特征。

英文摘要：

Human action recognition plays an important role in the field such as video supervision and medical diagnosis.Current methods are based on the expansion from two-dimension artificial design features to three-dimensions,ones or extracting spatio-temporal features via trajectories.Based on deep learning methods,this paper proposes a multilayer neural network in three-dimensional space,learning rich spatio-temporal features from large amount of videos.First,we use independent subspace analysis to build a two layer stacked convolutional neural network,obtaining weights from training database.Spatio-temporal features are then quantized into visual words with K-means clustering.Non-linear support vector machine（SVM）were used to classify frequency histograms of visual words into different action groups.We apply our algorithm to Hollywood2 database,extracting spatio-temporal features from 12 human action groups.Result shows that the feature weights trained by ISA network are similar with those by Gabor filter,which have obvious selectivity of frequency and direction,robustness to phase variation,conforming to the human visual system.

同期刊论文项目

面向非规则计算算法的FPGA逻辑映射优化

期刊论文 28 会议论文 4 专利 3

同项目期刊论文

应用于ROHC的CRC算法硬件实现

基于ARM Cortex-A8平台的警务终端硬件设计

Performance effects of pipeline architecture on an FPGA-based binary32 floating point multiplier

基于压缩感知的多特征实时跟踪

双CMOS成像系统中运动模糊图像的复原

联合梯度直方图和局部二值模式特征的人体检测

气象卫星闪电识别系统的设计与实现

遥感卫星CCD相机模拟源的研制

最小化预测残差的图像序列压缩感知

遮挡环境下采用在线Boosting的目标跟踪

高速多通道遥感相机快视系统的实现

多通道高保真音频信号ⅡR滤波器设计

1 2位图像数据的压扩变换显示

一种基于FPGA的稀疏矩阵高效乘法器

量子级联激光器的一种新的等效电路模型

一种高效双精度浮点乘法器

双输出FPGA基本逻辑单元结构的布局布线影响研究

基于FPGA的高速双精度浮点乘法器设计

基于单调优化框架的凸松弛分支定界算法求解非凸多信道联合感知问题

正交频分多址接入系统中双层毫微微蜂窝资源分配策略

一种星载综合电子系统数据处理技术

基于contourlet变换的多尺度图像质量评价

Fabric Defect Detection Using Independent Component Analysis and Phase Congruency

期刊信息

《武汉大学学报：信息科学版》
中国科技核心期刊

主管单位:国家教育部
主办单位:武汉大学
主编：刘经南
地址：湖北武汉珞珈山
邮编：430072
邮箱：whuxxb@vip.163
电话：027-68778045

国际标准刊号：ISSN：1671-8860
国内统一刊号：ISSN：42-1676/TN
邮发代号:38-317

获奖情况:
全国优秀科技期刊,全国优秀高校自然科学学报一等奖,湖北省优秀期刊称号

国内外数据库收录:
俄罗斯文摘杂志,荷兰地学数据库,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:24217