位置:成果数据库 > 期刊 > 期刊详情页
基于自相似的气象数据分类识别方法
  • ISSN号:1001-9081
  • 期刊名称:《计算机应用》
  • 时间:0
  • 分类:TP393.0[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]解放军理工大学气象海洋学院,南京211101, [2]中国人民解放军61741部队,北京100094
  • 相关基金:国家自然科学基金资助项目(61371119)
中文摘要:

气象卫星和雷达资料的数据文件往往达到几十兆甚至上千兆字节,根据扩展名对文件进行分类仅是一种约定俗成,不具备基于数据特征的属性,因而在一定程度上缺乏可靠性。通过统计分析可得到典型气象数据的一些编码特性,但若对全文件进行值谱分析,效率低,因此需要研究快速准确的大文件分类识别方法。在研究已有文件分类方法的基础上,分析研究典型气象数据的字节值频率分布统计特征,作为分类的特征参数;采用自相似理论,自适应确定文件的截取长度和截取原点,提出了最小特征文件块指纹模型,设计了基于自相似的大数据文件快速识别算法。实验表明该算法在保证数据类型识别的查准率和查全率的基础上,大幅度减少了大文件数据分类的时间。

英文摘要:

The meteorological satellite and radar files often have dozens or even hundreds of megabytes. Classification according to the extensions of files is just a conventional method,it has no attribute based on the features of data,thus to some extent,it is lack of reliability. Via statistical analysis the encoding rules of typical meteorological data can be acquired,but it is a low-efficient way to analyze the spectrum of the entire file,so we need to find a fast and accurate method for big file classification and recognition. Based on the existing research on file classification,analyzing and researching the statistical characteristics of BFD( Byte Frequency Distribution) of typical meteorological data, accepting self-similarity theory,presenting a finger model of minimum file blocks of features,this paper devised a fast recognition algorithm of big file based on the theory of self-similarity. Experiments show that the algorithm greatly improves the classification rate of large files; at the same time,it ensures the precision and recall of data type identification.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术协会
  • 主办单位:四川省计算机学会中国科学院成都分院
  • 主编:张景中
  • 地址:成都市人民南路四段九号科分院计算所
  • 邮编:610041
  • 邮箱:xzh@joca.cn
  • 电话:028-85224283
  • 国际标准刊号:ISSN:1001-9081
  • 国内统一刊号:ISSN:51-1307/TP
  • 邮发代号:62-110
  • 获奖情况:
  • 全国优秀科技期刊一等奖,国家期刊奖提名奖,中国期刊方阵双奖期刊,中文核心期刊,中国科技核心期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:53679