位置:成果数据库 > 期刊 > 期刊详情页
基于在线百科全书的群体兴趣及其关联性挖掘
  • ISSN号:0254-4164
  • 期刊名称:计算机学报
  • 时间:2011.11
  • 页码:2234-2242
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国人民解放军理工大学指挥自动化学院,南京210007, [2]中国人民解放军国防信息学院.武汉430010, [3]中国电子系统工程研究所,北京100141, [4]武汉大学软件工程国家重点实验室,武汉430072
  • 相关基金:国家自然科学基金(69120912 61035004); 国家“九七三”重点基础研究发展规划项目基金(2007CB310804); 中国博士后科学基金(20090460107 201003794)资助
  • 相关项目:基于云计算的海量数据挖掘关键技术研究
中文摘要:

针对协同过滤、基于内容过滤等个性化推荐方法所存在的用户隐私数据收集、冷启动等问题,提出一种群体兴趣及其关联性的挖掘方法,并应用于推荐领域.以维基百科作为数据源,获取用户社团及其编辑的词条,设计了以词条及其所属类别为基础的泛树结构生长策略,使用泛树结构表征用户社团所对应的兴趣点.结合用户社团的结构特征和兴趣点的语义特征给出了用户社团对兴趣点的关注度及兴趣点间关联性的定义,用此群体兴趣取代个性化推荐方法中的个体兴趣,进行了人工直观评价、测试集对比以及视频点播中的新闻推荐等三种实验.结果表明,测试集上群体兴趣关联性的准确度达到了50%,高于基准协同推荐方法的准确度;新闻推荐实验中,本方法比按热度推荐方法获得了高出近一倍的点击率,验证了群体兴趣及其关联性的合理性.

英文摘要:

Personalized recommendation technologies,such as collaborative filtering and content based filtering,face some problems.The obvious ones are the privacy history data collection and cold start.In this paper,we suggest a group interests mining method from Wikipedia.We also apply the group interests into the recommendation system,which avoid the cold start,and don't need any privacy data.Here,the group interest replaces the personalized interest in the traditional personalized recommendation technologies.In detail,we first suggest a general tree structure and a growing strategy to denote the interest of a users group,which includes the semantic relationship of each interest.Then we define the group interest based on the structure of users groups.At last,we measure the correlations of interests according to the general tree structure of interests.We further design three types of experiment to evaluate the reasonability of group interests,which is manual evaluation,test set evaluation and a news recommendation experiment in video service.The results show that,the accuracy of correlation between group interests can be more than 50%,and the news hits rate on the recommendation from group interests is 2 times larger than that on the recommendation from news popularity.

同期刊论文项目
期刊论文 72 会议论文 63 获奖 10 专利 7 著作 3
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433