入侵检测数据具有连续到达、快速更新、高维、偏斜分布、及概念漂移的特点,这些特点导致目前的数据流挖掘算法不能直接应用到入侵检测中,同时对数据流研究领域提出了新的研究挑战。本项目从入侵检测数据的本质特征入手,采用理论分析和实验研究相结合的方法,研究面向入侵检测的数据流挖掘方法,研究重点包括特征选择、未标记数据学习、概念漂移处理等。项目主要得到以下几个方面的研究成果1.在均衡分布的数据流上,提出了基于改进信息增益的增量特征选择算法IFS。 2.针对高维偏斜分布的数据流提出一种基于差异系数的增量特征选择算法CVIFS。3.提出了一种基于粗糙集和信息增益的属性约简改进算法4.提出了单类别自适应朴素贝叶斯算法UP-AB。5.提出一种基于组合分类器的单类别数据流分类算法OcHCD。6.基于重用数据的偏斜数据流分类算法。
英文主题词intrusion detection;data stream mining;skewed distribution;concept drifting;feature selection