本项目就Web社区识别及与此问题密切相关的数据聚类和Web链接分析等问题展开了深入的研究,在几个方面均取得了突破性进展。在 Web链接分析方面,提出了"基于目标区分的信任指数和不可信指数同步传播作弊网页检测算法",被评价为"开创性的工作、为后续研究奠定了更深层次的基础"。在子空间聚类方面,指出了"子空间聚类中的维度关联及不同维上测度差异等问题对聚类结果及算法效率的重要影响",被评价为"以往工作没有意识到的重要发现"。在Web社区发现方面,首次提出了"任意尺寸自动社区核发现发现算法",弥补了著名的"拖网"算法的不足。在包括国际期刊Neurocomputing、Pattern Recognition Letters, 顶级国际会议AAAI、ICDM在内的期刊和会议上发表和录用论文25篇。主办国际会议一次,参加国际会议3人次。培养硕士毕业生16名 ,在读硕士生9名,在读博士生2名。项目负责人于2011年入选教育部新世纪优秀人才支持计划。
英文主题词Web community identification; Data clustering; Web link analysis