近年来,各种聚类分析方法已经在数据挖掘领域中得到了较为深入的研究,但这些方法大多是针对关系数据库中的静态数据对象而提出的。然而在现实世界中越来越多的应用涉及到随时间动态变化的数据对象的聚类分析。本项目将针对客户关系管理中的动态客户细分这一实际应用背景,将领域知识引入知识发现过程中,根据粒度计算的分而治之思想,分别建立多时间窗口演化聚类模型和用户感兴趣窗口聚类模型,并给出模型的求解算法及参数的选取与估计方法。主要研究内容包括(1)演化聚类中的领域知识表示方法;(2)基于核集的多时间窗口演化聚类模型及算法;(3)基于高斯核密度估计的用户感兴趣窗口聚类模型及算法;(4)基于演化聚类的汽车客户动态细分方法及软件原型系统。演化聚类有着广泛而重要的应用背景,本项目的研究将有利于推动动态数据挖掘聚类方法的进一步发展,具有重要的理论意义和实用价值。
dynamic data mining;clustering analysis;evolutionary clustering;customer relationship management;customer segmentation
近年来,各种聚类分析方法已经在数据挖掘领域中得到了较为深入的研究,但这些方法大多是针对关系数据库中的静态数据对象而提出的。然而在现实世界中越来越多的应用涉及到随时间动态变化的数据对象的聚类分析。本项目针对客户关系管理中的动态客户细分这一实际应用背景,将领域知识引入知识发现过程中,建立了多种演化聚类模型,并根据粒度计算的分而治之思想,给出了模型的求解算法及参数的选取与估计方法。主要研究成果包括(1)针对动态数据挖掘中的聚类问题,提出了增量AP聚类、微粒群优化演化聚类、动态复杂网络社区发现等多种有效的演化聚类模型与算法;(2)对聚类模型与算法进行了聚类数目估计、扰动分析、稀疏成分分析等方面的理论分析,提出了区间型符号数据的特征选择方法和可用于聚类分析的可视化降维方法;(3)提出了基于演化聚类的汽车客户动态细分方法和客户群变化挖掘方法以及多种时间序列数据挖掘方法;(4)针对决策信息不完全条件下的多粒度不确定语言型多属性群决策问题,提出了多种具有残缺和不确定信息的群决策方法。在《IEEE Transactions on Knowledge and Data Engineering》、《Journal of Systems Engineering and Electronics》、《SCIENCE CHINA Information Sciences》、《International Journal of Systems Science》、《Knowledge and Information Systems》等重要国际学术期刊上发表了12篇SCI检索收录论文。在《管理工程学报》、《情报学报》、《系统管理学报》、《运筹与管理》、《工程数学学报》、《科研管理》等中文核心期刊上发表了11篇论文。