位置:成果数据库 > 期刊 > 期刊详情页
一种大规模图数据上已知项搜索的优化方法
  • ISSN号:1000-1239
  • 期刊名称:计算机研究与发展
  • 时间:2014.1.1
  • 页码:54-63
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:武汉大学软件工程国家重点实验室,湖北武汉430072
  • 相关基金:国家自然科学基金资助项目(61272275,61232002,61202036,61272110).
  • 相关项目:基于反模式和缺陷修复模式的软件缺陷结构影响因素分析
中文摘要:

为解决社交媒体中缄默用户的性别预测问题,提出利用用户文件夹中的兴趣标签进行区分的方法.针对标签存在稀疏和歧义性的特点,设计了一种基于概念类推断用户性别的框架.首先依据社交心理特征将标签划分为若干概念类;其次通过关联挖掘方法扩充概念类;最后通过概念类压缩用户特征空间.在新浪微博真实数据集上进行验证,实验结果表明:所提方法对于缄默用户性别有显著的区分效果,在不使用任何微博信息的条件下,区分准确率达到71%.

英文摘要:

The problem of gender prediction was studied for mute users in social media. A novel ap- proach using the interest tags in users' profile was proposed. In order to solve the problems caused by the sparse and ambiguous property of the tags, a framework was designed, which used the conceptual class to infer the gender of mute users. Firstly, the interest tags were divided into a set of conceptual classes according to the social-psychological characteristics. Second, the conceptual classes were ex- panded based on association mining. Finally, the conceptual classes were used to condense the usersr feature space. Extensive experiments were conducted on a real data set extracted from Sina Weibo. Experimental results demonstrate that the proposed approach can make accurate predictions on mute ' users genders. Its accuracy achieves 71% without using any micro-blog information.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机研究与发展》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院计算技术研究所
  • 主编:徐志伟
  • 地址:北京市科学院南路6号中科院计算所
  • 邮编:100190
  • 邮箱:crad@ict.ac.cn
  • 电话:010-62620696 62600350
  • 国际标准刊号:ISSN:1000-1239
  • 国内统一刊号:ISSN:11-1777/TP
  • 邮发代号:2-654
  • 获奖情况:
  • 2001-2007百种中国杰出学术期刊,2008中国精品科...,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:40349