位置:成果数据库 > 期刊 > 期刊详情页
一种高效的属性图聚类方法
  • ISSN号:0254-4164
  • 期刊名称:计算机学报
  • 时间:2013.8.8
  • 页码:1704-1713
  • 分类:TP301[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]国防科学技术大学电子科学与工程学院,长沙410073
  • 相关基金:国家自然科学基金(61070035,60902036,41271403);国家“八六三”高技术研究发展计划项目基金(2011AA120306);高等学校博士学科点专项科研基金(20104307110017);湖南省自然科学基金(11JJ4028)资助
  • 相关项目:面向共享Cache多核处理器的数据库查询执行优化算法研究
中文摘要:

图是描述现实世界各类复杂系统的一种普适模型,且许多实际应用中的图是大规模的.图的聚类是理解、分析和可视化大规模图的关键技术之一.现实世界的图往往包含丰富的属性信息,如何综合结构和属性信息进行属性图的聚类是一个新的挑战.大多数的现有方法或者将结构和属性转化为距离,基于传统方法进行聚类;或者只考虑某一方面聚类.文中结合信息论中最小长度原则,基于遗传算法,提出一种高效的属性图聚类方法GA-AGC.通过对属性图聚类问题建模,转化为最小描述长度原则问题;扩展标签传播方法作为遗传算法初始化方法,结合编码减小的局部变异方法,提出一种解决属性图聚类的遗传算法.文中方法无需设定聚类的数目,算法复杂度近似线性于结点和边的数目.真实数据集上的实验验证了算法的有效性和高效性.

英文摘要:

Graph is a universal model to describe real world complex systems,and large graph datasets are common in many application domains.Graph clustering techniques are critical for understanding,analyzing as well as visualizing large graphs.However,with the proliferation of rich attribute information available for objects in real-world graphs,how to leverage structure and attribute information for clustering attributed graphs becomes a new challenge.Most of the existing methods either take traditional clustering approaches by converting structure and attribute information into distance,or just consider one of the two aspects.In this paper,we propose a novel attributed graph clustering method GA-AGC,based on genetic algorithm and Minimum Description Length(MDL).By analyzing the problem of attributed graph clustering,we convert it to the category of Minimum Description Length.The genetic algorithm solution adopts an extended label propagation method as its initialization procedure,and combines a local mutation operator with decreasing description length.The algorithm proposed requires no specified number of clusters,and its running time scales linearly with total number of graph nodes and edges.Extensive experiments on real-life datasets prove the effectiveness and efficiency of our proposed method.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433