东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于多尺度分块卷积神经网络的图像目标识别算法

ISSN号：1001-9081
期刊名称：《计算机应用》
时间：0
分类：TP391.41[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：空军工程大学航空航天工程学院,西安710038
相关基金：国家自然科学基金资助项目（61372167,61379104）~~

关键词：卷积神经网络, 自动编码器, 非监督训练, 多尺度分块, 目标识别, Convolutional Neural Network（CNN）, autoencoder, unsupervised pre-training, multi-scale blocking, target recognition

中文摘要：

针对图像在平移、旋转或局部形变等复杂情况下的识别问题,提出一种基于非监督预训练和多尺度分块的卷积神经网络（CNN）目标识别算法。算法首先利用不含标签的图像训练一个稀疏自动编码器,得到符合数据集特性、有较好初始值的滤波器集合。为了增强鲁棒性,同时减小下采样对特征提取的影响,提出一种多通路结构的卷积神经网络,对输入图像进行多尺度分块形成多个通路,每个通路与相应尺寸的滤波器卷积,不同通路的特征经过局部对比度标准化和下采样后在全连接层进行融合,从而形成最终用于图像分类的特征,将特征输入分类器完成图像目标识别。仿真实验中,所提算法对STL-10数据集和遥感飞机图像的识别率较传统的CNN均有提高,并对图像各种形变具有较好的鲁棒性。

英文摘要：

The deformation such as translation,rotation and random scaling of local images in image recognition tasks is a complicated problem. An algorithm based on pre-training convolutional filters and Multi-Scale block Convolutional Neural Network（ MS-CNN） was proposed to solve these problems. Firstly,the training dataset without labels was used to train a sparse autoencoder and get a collection of convolutional filters with characteristics in accord with the dataset and good initial values. To enhance the robustness and reduce the impact of the pooling layer for the feature extraction,a new Convolutional Neural Network（ CNN） structure with multiple channels was proposed. The multi-scale block operation was applied to input image to form several channels,and each channel was convolved with corresponding size of filter. Then the convolutional layer,a local contrast normalization layer and a pooling layer were set to obtain invariability. The feature maps were put in the full connected layer and final features were exported for target recognition. The recognition rates of STL-10 database and remote sensing airplane images were both improved compared to traditional CNN. The experimental results show that the proposed method has robust performance when dealing with deformations such as translation,rotation and scaling.

同期刊论文项目

基于视觉认知的大景深雾霾退化图像去雾技术研究

期刊论文 29

面部运动视觉认知表达及分析方法研究

期刊论文 31

同项目期刊论文

基于笛卡尔乘积字典的稀疏编码跟踪算法

雾霾天气下可见光图像场景再现

单幅图像去雾方法研究

基于景深约束的单幅雾天图像去雾算法

仿射变换在压缩感知跟踪中的应用

一种基于参数估计的自适应双边滤波算法

一种利用最大间隔相关滤波的鲁棒目标跟踪算法

仿视皮层机制的随机点视频序列运动特征提取

基于蚁群算法的广义扩展双桥问题的最优解

边缘和对比度增强的NSST域红外与可见光图像融合

利用形状估计的人脸特征点定位算法

基于混合遗传BP神经网络的城市系统作战能力评估

基于视皮层V1模型的随机点视频序列运动特征提取

基于负修正和对比度拉伸的快速去雾算法

仿视皮层V1结构的纹理特征提取

基于马尔可夫随机场框架的单幅图像去雾

奇异值分解去噪中有效秩阶次的自身辅助确定

基于小波变换和深层稀疏编码的SAR目标识别

基于分类学习的去雾后图像质量评价算法

基于人眼视觉皮层系统的SAR图像目标识别

基于局部一致性的马尔可夫随机场去雾

基于多尺度V1-MT前馈模型的光流计算方法

基于双向耦合的单幅图像快速去雾算法

基于人眼视觉机理的雾霾图像质量提升算法

序列图像运动自适应V1—MT光流估计算法

基于改进遗传算法和Sin-Chirplet原子的调频雷达信号稀疏分解

基于稀疏编码和岭回归的文本图像复原算法

基于笛卡尔乘积字典的稀疏编码跟踪算法

雾霾天气下可见光图像场景再现

单幅图像去雾方法研究

基于景深约束的单幅雾天图像去雾算法

仿射变换在压缩感知跟踪中的应用

一种基于参数估计的自适应双边滤波算法

仿视皮层机制的随机点视频序列运动特征提取

利用形状估计的人脸特征点定位算法

基于混合遗传BP神经网络的城市系统作战能力评估

基于视皮层V1模型的随机点视频序列运动特征提取

仿视皮层V1结构的纹理特征提取

基于马尔可夫随机场框架的单幅图像去雾

奇异值分解去噪中有效秩阶次的自身辅助确定

基于小波变换和深层稀疏编码的SAR目标识别

基于分类学习的去雾后图像质量评价算法

基于人眼视觉皮层系统的SAR图像目标识别

基于局部一致性的马尔可夫随机场去雾

基于多尺度V1-MT前馈模型的光流计算方法

基于双向耦合的单幅图像快速去雾算法

序列图像运动自适应V1—MT光流估计算法

基于稀疏编码和岭回归的文本图像复原算法

融合超像素的黄金暗通道单幅图像去雾方法

基于脉冲发放皮层模型的图像分割方法

基于多分PSO算法的阵列天线方向图综合

基于相对距离分布聚类的人脸特征点定位算法

基于LS-GPR的OFDM信道估计算法

支撑驱动的非凸压缩感知恢复算法

基于改进G—GIFSS算法的雷达LPI性能评估方法

基于模糊聚类回归的人脸特征点定位研究

改进的二维最小卡方散度图像分割方法

期刊信息

《计算机应用》
北大核心期刊（2011版）

主管单位:四川省科学技术协会
主办单位:四川省计算机学会中国科学院成都分院
主编：张景中
地址：成都市人民南路四段九号科分院计算所
邮编：610041
邮箱：xzh@joca.cn
电话：028-85224283

国际标准刊号：ISSN：1001-9081
国内统一刊号：ISSN：51-1307/TP
邮发代号:62-110

获奖情况:
全国优秀科技期刊一等奖,国家期刊奖提名奖,中国期刊方阵双奖期刊,中文核心期刊,中国科技核心期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:53679