位置:成果数据库 > 期刊 > 期刊详情页
面向Weblog的模糊协同聚类算法
  • ISSN号:1009-5896
  • 期刊名称:《电子与信息学报》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]中国科学技术大学计算机科学与技术学院,合肥230036, [2]皖西学院信息工程学院,六安237012
  • 相关基金:国家自然科学重点基金(60775037,60933013); 教育部博士基金(20093402110017); 安徽省自然科学基金(11040606M150,090412261x); 安徽省教育厅重点项目(KJ2012A274,KJ2011Z321)资助课题
中文摘要:

面向Weblog的协同聚类算法具有同时发现用户聚类及与之对应的页面聚类的能力,已成为Weblog数据挖掘的重要研究内容。由于现有的面向Weblog的协同聚类算法大多采用硬划分方法将用户和页面分配到聚类,因此,无法很好地处理聚类边界的问题,即一个用户可能属于多个聚类,从而影响了聚类质量。该文给出了一种面向Weblog的模糊协同聚类FCOW(Fuzzy CO-clustering for Weblog)算法来解决协同聚类算法的边界问题,以提高聚类结果的质量。该算法首先利用矩阵Hadamard积运算发现Weblog中隐含的独立用户模式1={,,K}PA pa pa;其次,依据pa k所对应的页面子集将剩余用户分配到该独立模式中,从而产生协同聚类结果 {k,k}CS CP,k=1,,K;最后计算每个用户和页面与协同聚类之间的模糊隶属度,并以该隶属度作为个性化推荐的依据。实验结果表明,FCOW算法具有获得高质量聚类结果的能力。

英文摘要:

Weblog co-clustering is an important research content of Weblog mining,which has ability to find out the users clusters and pages clusters simultaneously.Most of the proposed Weblog co-clustering algorithm use hard partition method to assign the users into its corresponding cluster.However,hard partition method make these clustering algorithm can not handle the cluster's bond problem very well,which has significant influence for the clustering result quality.In this paper,a Fuzzy CO-clustering for Weblog(FCOW) algorithm is proposed to overcome the default of hard partition and improve the clustering results quality of Weblog co-clustering.In particularly,the underlying users model set is first found by using Hadamard product;and then,the rest users are assigned to its corresponding model based on page subset to generate the co-clustering result;Finally,the fuzzy membership of each user to its page cluster is calculated and this information is used to do recommendation.Experimental results on five real world datasets show that FCOW has ability for improving the clustering quality of Weblog co-clustering.

同期刊论文项目
期刊论文 52 会议论文 84
同项目期刊论文
期刊信息
  • 《电子与信息学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院电子学研究所 国家自然科学基金委员会信息科学部
  • 主编:朱敏慧
  • 地址:北京市北四环西路19号
  • 邮编:100190
  • 邮箱:jeit@mail.ie.ac.cn
  • 电话:010-58887066
  • 国际标准刊号:ISSN:1009-5896
  • 国内统一刊号:ISSN:11-4494/TN
  • 邮发代号:2-179
  • 获奖情况:
  • 国内外数据库收录:
  • 荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:24739