RSS文档聚合是Web 2.0的特色技术,目前RSS相关性阅读还仅限于简单的相同标签聚合.为解决此问题,提出了基于RSS标签聚类的新方法,主要工作包括:1)分析传统RSS聚合方法的不足之处;2)提出了RSS标签排名的概念和计算方法,将标签计数转化为了标签排名,消除了部分噪音;3)提出标签比重积累的RSS标签排名的Hash聚类方法;4)做了详实的实验.实验表明,新的RSS相关性文档聚类方法准确度提高了7%.