位置:成果数据库 > 期刊 > 期刊详情页
基于关联关系分析的符号数据分类方法
  • ISSN号:0469-5097
  • 期刊名称:《南京大学学报:自然科学版》
  • 时间:0
  • 分类:P315.69[天文地球—地震学;天文地球—固体地球物理学;天文地球—地球物理学]
  • 作者机构:[1]山西大学计算机与信息技术学院,太原030006, [2]山西大学计算智能与中文信息处理教育部重点实验室,太原030006
  • 相关基金:国家自然科学基金(61673249,61503229,61273291); 山西省回国留学人员科研项目(2016-004); 山西省自然科学青年基金(2015021096); 山西省高等学校科技创新项目(2015110)
中文摘要:

由于符号属性数据缺乏固有的几何特性,不能简单地将现有的数值属性数据分类算法应用于符号属性数据.为了提高符号属性数据的性能,提出一种基于关联关系分析的支持向量机分类方法(Support Vector Machine Classification Approach Based on Correlation Analysis,CA_SVM).通过分析属性值与标签之间的相关性,得到属性值对标签的影响因子;然后结合属性值在类内出现的频率,使得所有原始符号数据下的属性值在不失信息的情况下转换成数值型数据;转换后的数据既可以体现属性值与标签之间的关联关系,也可以有效地表示相同属性下属性值之间的距离;最后用支持向量机(Support Vector Machine,SVM)进行分类.在标准UCI数据集上的实验结果表明,CA_SVM模型能够提高分类精度.

英文摘要:

Due to lack of geometric property between categorical data,the current classification algorithms for numerical data fail to deal with categorical data.To effectively improve the classifying performance in a set of categorical objects,we proposed a support vector machine classification approach based on correlation analysis,namely CA_SVM.By analyzing the correlation between attribute values and labels and the frequency of attributes in the class,we get the influence factors of attribute values on label.The approach,which can not only reflect the correlation between attribute values and labels,but also effectively expresses the distance between attribute values,may transform a set of categorical data into numerical data without losing information.The classifying performance of new proposed method was tested on data sets downloaded from the UCI.Results illustrate that the new proposed CA_SVM model increases the classifying accuracy.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《南京大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国教育部
  • 主办单位:南京大学
  • 主编:龚昌德
  • 地址:南京汉口路22号南京大学(自然科学版)编辑部
  • 邮编:210093
  • 邮箱:xbnse@netra.nju.edu.cn
  • 电话:025-83592704
  • 国际标准刊号:ISSN:0469-5097
  • 国内统一刊号:ISSN:32-1169/N
  • 邮发代号:28-25
  • 获奖情况:
  • 中国自然科学核心期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9316