随着社会化网络的飞速发展,协同检索成为信息检索领域的研究热点,它对于提高社区内用户检索的准确率和效率具有重要的实际意义。社区不断变化,因此需要对社区信息持续更新,但检索过程的特点为此造成了很大困难,包括①数据稀疏;②特征空间维度高;③数据更新频繁。本课题围绕以上三个特点展开研究,内容包括⑴三维空间相关性模型建立由用户、查询和文档构成的三维空间,并采用概率方法量化三个维度间的相关性;⑵基于联合聚类的社区动态确定方法针对检索过程的特点①和②,将原本仅用于分析二维列联表的信息论联合聚类方法进行扩展,使之适用于分析三维问题,进而动态确定用户社区;⑶增量学习机制针对检索过程的特点③,从数据所在维入手,增量更新三维概率关系及联合聚类结果。本课题基于三维空间的概率关系,重点围绕社区的动态更新问题,兼顾理论分析和实践验证,为协同检索方法的进一步研究与应用提供新的思路。
英文主题词information bottleneck;information retrieval;fuzzy clustering;co-clustering;incremental clustering