本项目研究群体关系数据挖掘的关键技术及其在电信领域的应用。群体关系数据挖掘是在多关系数据挖掘、基于图的数据挖掘以及复杂系统理论等基础上形成的知识发现新模式。本项目主要研究群体关系及结构的涌现过程及特点,提出群体关系的知识表示方法及原则,研究大规模数据集中群体关系与结构自动提取和分类方法,并研究群体关系与群体背景关联分析算法以及时变关系结构演化分析算法,最后在分析电信社群网络特征基础上,将相关算法应
复杂网络的泛在性和多样性使得复杂网络成为近几年的一个交叉学科研究热点。本项目研究了面向复杂网络的智能信息处理技术,其中包括复杂网络基本特征并行计算方法、多领域的复杂网络构建方法、复杂网络建模与结构分析方法以及复杂网络可视化技术,并结合电信客户关系管理、科技文献计量、社会网络分析、软件理解、公交网络分析等实际问题展开应用研究。具体地提出了中介性并行计算算法;提出了复杂网络节点消退模型和基于团队叠加的网络生成模型;结合基于图的数据挖掘技术,先后提出了复杂网络最大团、极大团、K-丛等典型结构高效挖掘算法以及基于极大团的复杂网络社团发现算法,并提出了结合节点和边属性以及结构时变特征提取的社团简历挖掘算法;探索了面向复杂网络数据的可视分析系统所涉及的数据模型、软件架构、多维分析、布点算法、网络约简等软件系统及可视化方面的关键技术。所提分析算法实现了百万级点规模的电信呼叫数据和科研合作网络数据的实际应用,表现出良好的可伸缩性。本项目相关技术已在电信客户分析、科技信息服务等领域以及国家有关部门得到应用。本项目在KDD 和ICDM数据挖掘重要会议的专题讨论会上发表了3篇论文并发表各类论文30余篇。