位置:成果数据库 > 期刊 > 期刊详情页
采用对象特征向量表示法的标签聚类算法
  • ISSN号:1000-1220
  • 期刊名称:小型微型计算机系统
  • 时间:2012
  • 页码:-
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]中国科学技术大学多媒体计算与通信教育部-微软重点实验室,合肥230027, [2]中国科学技术大学图书馆,合肥230027
  • 相关基金:国家"八六三"高技术研究发展计划项目(2008AA01Z117)资助; 国家自然科学基金重点项目(60933013)资助; 国家"八六三"重大专项项目(2010ZX03004-003)资助; 博士学科点专项科研基金项目(20070358040)资助
  • 相关项目:面向Web的社会网络理论与方法研究
中文摘要:

在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标签聚类算法,充分考虑标签的标记信息,采用基于对象的特征向量来精确地表征一个标签,根据余弦相似度公式得到较为准确的标签相似度,然后采用K-Means算法将用户标签进行聚类.实验结果表明该算法能够得到更加精确的聚类结果.

英文摘要:

In the social tagging systems,it often uses data mining techniques,such as clustering,to remedy the problems of tag redundancy and ambiguity.The current tag clustering algorithms are mainly based on the tag co-occurrence in different items,but these algorithms′ clustering precision and recall are relatively low,which can only calculate the similarity between two tags.This paper proposes a new tag clustering algorithm,which introduces an object-based feature vector to characterize a single tag.This feature vector can represent a tag exactly and can get a more accurate similarity between two tags by using cosine similarity formula.K-Means algorithm is used to cluster the users′ tags.The experiment shows that the algorithm proposed in this paper can get a more accurate clustering result.

同期刊论文项目
期刊论文 52 会议论文 84
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212