异常检测是近年来模式识别和机器学习领域的一个研究热点,它能够对其训练过程中不曾出现的异常数据成功地加以辨识。但是现有的异常检测模型存在以下缺陷计算复杂度高,不适于处理大规模数据集;处理高维数据时存在"维数灾难"难题;对正常数据的分布不能很好地进行拟合,所得分类边界不够紧致。本课题旨在克服现有异常检测模型的上述缺陷并开展实例应用研究,拟解决的主要问题是1. 提出基于自适应聚类和局部最小包围球的快速异常检测模型,在提高分类性能的同时减小模型训练的时间复杂度;2. 为异常检测建立基于核方法的非线性特征提取策略、filter特征选择策略及wrapper特征选择策略,提高异常检测模型的训练效率和解释能力;3. 提出基于bagging和boosting、基于神经网络及基于聚类集成方法的一类分类器集成,使集成后的模型具有更为紧致的分类边界;4. 将上述所提模型方法应用于基于相关反馈技术的图像检索。
Novelty detection;Dimensionality reduction;Ensemble of OCC;Image retrieval;
异常检测是近年来模式识别和机器学习领域的一个研究热点,它能够对其训练过程中不曾出现的异常数据成功地加以辨识。但是现有的异常检测模型存在以下缺陷计算复杂度高,不适于处理大规模数据集;处理高维数据时存在“维数灾难”难题;对正常数据的分布不能很好地进行拟合,所得分类边界不够紧致。本课题旨在克服现有异常检测模型的上述缺陷并开展实例应用研究。 完成的主要内容为1. 提出了基于自适应聚类和局部最小包围球的异常检测模型;2. 为异常检测建立了适用的特征提取策略,并对现有维数约减方法(包括模糊粗糙集技术、二维特征提取方法)开展了研究;3. 提出了基于改进AdaBoost和基于相关熵的一类分类器集成,使得集成后的模型具有更为紧致的分类边界;4. 结合本研究组和研究工作的特点,对支持向量机、神经网络及主动学习开展了研究;5. 将基于改进AdaBoost的一类分类器集成应用于基于相关反馈技术的图像检索。