位置:成果数据库 > 期刊 > 期刊详情页
面向不完全攻击数据集的两阶段聚类算法
  • ISSN号:1009-5896
  • 期刊名称:电子与信息学报
  • 时间:0
  • 页码:-
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:湖南大学信息科学与工程学院,长沙410082
  • 相关基金:国家自然科学基金(No.61070194)
  • 相关项目:基于高语义序列比对的网络攻击特征自动提取方法
中文摘要:

实时攻击数据集含有缺失属性和大量非攻击样本,呈现属性分布不完全和类分布偏斜的特点,不利于聚类分析。针对此问题,提出了一种面向不完全攻击数据集的两阶段聚类算法。算法首先利用标准2-类支持向量机分离数据集中的非攻击样本,使类分布均衡。提出一种不完全样本间的距离度量方法,将该方法应用于最近邻间隔模糊C均值算法实现聚类。实验结果表明,与现有算法相比,提出的算法有效地提高了聚类准确率。

英文摘要:

Due to including missing features and a large number of non-attack samples,real-time attack data set present incomplete feature distribution and skewed class distribution,which is adverse to clustering analysis. To solve this problem,a two-phase clustering algorithm for incomplete attack data set is proposed. Firstly,standard two-class support vector machine is used to separate non-attack samples and balance the class distribution. Secondly,a method of measuring the distance between incomplete samples is proposed. Then,this method is applied in the nearest-neighbor interval fuzzy C-means algorithm to implement clustering. Experimental results show that,this algorithm has better performance on clustering accuracy than existing algorithms.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电子与信息学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院电子学研究所 国家自然科学基金委员会信息科学部
  • 主编:朱敏慧
  • 地址:北京市北四环西路19号
  • 邮编:100190
  • 邮箱:jeit@mail.ie.ac.cn
  • 电话:010-58887066
  • 国际标准刊号:ISSN:1009-5896
  • 国内统一刊号:ISSN:11-4494/TN
  • 邮发代号:2-179
  • 获奖情况:
  • 国内外数据库收录:
  • 荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:24739