位置:成果数据库 > 期刊 > 期刊详情页
基于簇间分离性的稀有类识别算法
  • ISSN号:1003-6059
  • 期刊名称:《模式识别与人工智能》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]福建师范大学数学与计算机科学学院,福州350007, [2]福建师范大学网络安全与密码技术福建省重点实验室,福州350007
  • 相关基金:国家自然科学基金项目(No.61175123)、福建省高校产学合作科技重大项目(No.2010H6007)资助
中文摘要:

稀有类挖掘是数据挖掘的一个重要研究领域,具有广泛的应用背景.文中针对传统稀有类识别算法存在的缺陷,提出一种基于密度差异与簇间分离性判据相结合的稀有类识别算法(RDACS).该算法以特征权重相似度作为稀有类簇与周围数据样本问分离性的判据,并辅以积极学习的方法实现稀有类识别.在UCI公共数据集和KDD99数据集上的实验表明,与现有的同类算法相比,RDACS在询问次数指标上有较明显优势,能提高效率并减少人为误差,是现有稀有类识别方法的一种补充算法.

英文摘要:

The rare category mining, which is an important research field in data mining, is widely applied. Aiming at the defects of the traditional rare category recognition methods, an rare category detection algorithm based on cluster separability (RDACS), is proposed based on the combination of density difference and inter-cluster separability criterion for rare category mining. An active-learning scenario is used to detect rare category. The similarity of feature weight is applied to the separability of rare category cluster and its surrounding samples. The experimental results on UCI public datasets and KDD99 datasets show that compared with the existing similar algorithms, the RDACS algorithm has an advantage in the number of inquiries, which can significantly improve the efficiency and reduce human errors. RDACS is complementary to the existing rare category recognition methods.

同期刊论文项目
期刊论文 53 会议论文 11 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《模式识别与人工智能》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会 中国自动化学会
  • 主办单位:国家智能计算机研究开发中心 中国科学院合肥智能机械研究所
  • 主编:郑南宁
  • 地址:安徽省合肥市蜀山湖路350号中国科学院合肥智能机械研究所
  • 邮编:230031
  • 邮箱:bjb@iim.cas.cn
  • 电话:0551-5591176
  • 国际标准刊号:ISSN:1003-6059
  • 国内统一刊号:ISSN:34-1089/TP
  • 邮发代号:26-69
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:10169