位置:成果数据库 > 期刊 > 期刊详情页
基于Hausdorff距离的区间数据的系统聚类分析
  • ISSN号:1002-1566
  • 期刊名称:《数理统计与管理》
  • 时间:0
  • 分类:O212.4[理学—概率论与数理统计;理学—数学]
  • 作者机构:[1]天津大学管理与经济学部,天津300072
  • 相关基金:国家自然科学基金青年基金资助项目(70701026,71271147)
中文摘要:

基于Hausdorff距离用于定义两个紧集之间距离的考虑,将区间数视为一个紧集,定义了区间数之间的距离,并研究了区间向量的距离,从而得到聚类分析中两个样品间的距离。进一步定义了两个类之间的Hausdorff距离。为消除量纲对聚类结果的影响,研究了区间数据的标准化。基于此,给出了区间数据系统聚类算法。采用随机模拟的方法,对文中方法进行有效性评价,结论表明,Hausdorff距离法的聚类有效性在所有设计的实验条件下都要优于传统的欧式距离法。最后,基于符号数据分析的思想构造区间数据,给出了对多种动物群体按其身高、体重等生理特征进行聚类分析的算例。

英文摘要:

An interval being seen as a compact set, the distance between two interval numbers is defined based on ttausdorff distance which is used to define a distance between two compact sets. Furthermore, the distance between two interval vectors and two clusters were studied. To avoid the impact of different scales of the sample data, the normalization of interval data were studied. Based on this, the hierarchy clustering algorithm of interval data was proposed. A simulation study was conducted to evaluate our method. The results show that the method based on Hausdorff distance presented in the paper performs better than on Euclidean distance under all the situations designed in the simulation. Finally, an example of clustering several types of animals according to their heights and weights is given, where the interval data were achieved by the theory of symbolic data analysis.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《数理统计与管理》
  • 北大核心期刊(2011版)
  • 主管单位:中国科协
  • 主办单位:中国现场统计研究会
  • 主编:程维虎
  • 地址:中国科学院应用教学所内
  • 邮编:100190
  • 邮箱:sltj@amt.ac.cn
  • 电话:010-62651341
  • 国际标准刊号:ISSN:1002-1566
  • 国内统一刊号:ISSN:11-2242/O1
  • 邮发代号:82-69
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:13661