位置:成果数据库 > 期刊 > 期刊详情页
基于列式数据库的RDF数据分布式存储
  • ISSN号:1000-0984
  • 期刊名称:《数学的实践与认识》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:武汉大学软件工程国家重点实验室,湖北武汉430072
  • 相关基金:国家自然科学基金资助项目(61272275,61232002,61202036,61272110).
中文摘要:

为解决社交媒体中缄默用户的性别预测问题,提出利用用户文件夹中的兴趣标签进行区分的方法.针对标签存在稀疏和歧义性的特点,设计了一种基于概念类推断用户性别的框架.首先依据社交心理特征将标签划分为若干概念类;其次通过关联挖掘方法扩充概念类;最后通过概念类压缩用户特征空间.在新浪微博真实数据集上进行验证,实验结果表明:所提方法对于缄默用户性别有显著的区分效果,在不使用任何微博信息的条件下,区分准确率达到71%.

英文摘要:

The problem of gender prediction was studied for mute users in social media. A novel ap- proach using the interest tags in users' profile was proposed. In order to solve the problems caused by the sparse and ambiguous property of the tags, a framework was designed, which used the conceptual class to infer the gender of mute users. Firstly, the interest tags were divided into a set of conceptual classes according to the social-psychological characteristics. Second, the conceptual classes were ex- panded based on association mining. Finally, the conceptual classes were used to condense the usersr feature space. Extensive experiments were conducted on a real data set extracted from Sina Weibo. Experimental results demonstrate that the proposed approach can make accurate predictions on mute ' users genders. Its accuracy achieves 71% without using any micro-blog information.

同期刊论文项目
期刊论文 27 会议论文 11 著作 1
同项目期刊论文
期刊信息
  • 《数学的实践与认识》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院数学与系统科学研究院
  • 主编:林群
  • 地址:北京大学数学科学学院
  • 邮编:100871
  • 邮箱:bjmath@math.pku.edu.cn
  • 电话:010-62759981
  • 国际标准刊号:ISSN:1000-0984
  • 国内统一刊号:ISSN:11-2018/O1
  • 邮发代号:2-809
  • 获奖情况:
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:22973