位置:成果数据库 > 期刊 > 期刊详情页
基于熵权法的混合属性聚类算法
  • ISSN号:1001-4217
  • 期刊名称:汕头大学学报
  • 时间:2013.11
  • 页码:58-65
  • 分类:TP274[自动化与计算机技术—控制科学与工程;自动化与计算机技术—检测技术与自动化装置] TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]汕头大学工学院,广东汕头515063
  • 相关基金:国家自然科学基金资助项目(61170130)
  • 相关项目:高维混合型数据聚类及应用研究
中文摘要:

K—prototypes算法是处理混合数据的主要聚类算法,大部分针对混合型数据的聚类算法都是选择数据集中的一部分数据作为聚类对象,而忽略了这类数据的特殊性与整体性,为了改进了数据的距离衡量,文中提出了一种新的聚类方法,该方法采用信息熵作为属性的权值,进行高精度和更加稳定的聚类,最后通过Matlab编程实现,采用uci数据集中credit等数据集进行仿真实验,证明改进算法是正确和有效的.

英文摘要:

K-Prototypes algorithm is the main clustering algorithm for processing mixed data. Since most clustering algorithms for mixed data choose parts of the data set as clustering objects, and ignore the particularity and globality of the data, a new data distance measure is improved in this paper. A new clustering method is proposed using the entropy as the attribute weights for more accurate and more stable clustering. Finally, uci data set in Matlab is used and the algorithm is proved correct and effective.

同期刊论文项目
期刊论文 9 会议论文 7
同项目期刊论文
期刊信息
  • 《汕头大学学报:自然科学版》
  • 主管单位:广东省教育厅
  • 主办单位:汕头大学
  • 主编:尹业高
  • 地址:广东省汕头市大学路243号
  • 邮编:515063
  • 邮箱:cjf@stu.edu.cn
  • 电话:0754-82903827
  • 国际标准刊号:ISSN:1001-4217
  • 国内统一刊号:ISSN:44-1059/N
  • 邮发代号:46-17
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:1767