位置:成果数据库 > 期刊 > 期刊详情页
基于改进的分布式K-Means特征聚类的海量场景图像检索
  • ISSN号:1000-386X
  • 期刊名称:《计算机应用与软件》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]忻州师范学院计算机科学与技术系,山西忻州034000
  • 相关基金:国家自然科学基金项目(61202163);山西省高校大学生创新创业训练项目(2014383);山西省自然科学基金项目(2013011017-2);忻州师范学院重点学科专项课题(XK201308).
中文摘要:

针对传统的图像检索方法在处理海量数据时面临的问题,提出一种基于改进的分布式K-Means特征聚类的海量场景图像检索方法。对分布式K-Means算法进行改进,优化了初始聚类中心的选择和迭代过程,并将其应用与场景图像的特征聚类中;充分利用Hadoop分布式平台的海量存储能力和强大并行计算能力,提出了海量场景图像的存储和检索方案,设计了场景图像特征提取、特征聚类以及图像检索三个阶段分布式并行处理的Map和Reduce任务。多组实验表明,提出的方法数据伸缩率曲线平缓,取得了优良的加速比,效率大于0.6,检索的平均准确率达到了88%左右,适合海量场景图像数据的检索。

英文摘要:

Concerning that traditional image retrieval methods are confronted with the problems when processing massive data,we put forward a retrieval method for massive scene images,which is based on improved k-means feature clustering.We improved the distributed K-means algorithm,optimised the selection of initial cluster centres and the iteration procedure,and applied it to feature clustering of scene images.We made full use of the massive storage capacity and the powerful parallel computing ability of Hadoop distributed platform,proposed the storage and retrieval scheme on massive scene image,and designed the Map and Reduce tasks of three-phase distributed parallel processing on scene image with feature extraction,feature clustering and image retrieval.Sets of experiments demonstrated that the proposed method has gentle curve of data expansion rate,achieves good speedup ratio,the efficiency is greater than 0.6,and the average accuracy rate of retrieval reaches about 88%.The proposed scheme is suitable for large-scale scene image data retrieval.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用与软件》
  • 北大核心期刊(2011版)
  • 主管单位:上海科学院
  • 主办单位:上海市计算技术研究所 上海计算机软件技术开发中心
  • 主编:朱三元
  • 地址:上海市愚园路546号
  • 邮编:200040
  • 邮箱:cas@sict.stc.sh.cn
  • 电话:021-62254715 62520070-505
  • 国际标准刊号:ISSN:1000-386X
  • 国内统一刊号:ISSN:31-1260/TP
  • 邮发代号:4-379
  • 获奖情况:
  • 全国计算机类中文核心期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2011版),中国北大核心期刊(2000版)
  • 被引量:27463