位置:成果数据库 > 期刊 > 期刊详情页
基于HowNet的微博文本语义检索研究
  • ISSN号:1007-7634
  • 期刊名称:《情报科学》
  • 时间:0
  • 分类:G254.9[文化科学—图书馆学]
  • 作者机构:[1]杭州师范大学钱江学院,浙江杭州310018, [2]浙江大学数字图书馆工程研究中心,浙江杭州310012
  • 相关基金:浙江省自然科学基金项目(LQ14F020008);国家自然科学基金项目(61202282)
中文摘要:

随着新浪等微博用户的不断增长,微博网站已经成为人们获取信息和创造信息的主要平台。现有微博平台的检索功能只能靠关键词匹配返回检索结果,使得检索结果无法满足用户需求。为了解决该问题,提出一种基于HowNet知识库系统的微博语义检索方法。利用HowNet知识库系统分别将中文待检索主题词和微博文本词汇进行语义相关度匹配,返回和待检索词汇语义相关度较高的微博文本,最后针对新浪微博数据集进行语义检索实验。实验结果表明,利用HowNet系统能够从语义层面上获得较高的查准率,为用户提供更满意的检索效果。

英文摘要:

Microblog semantic retrieval has become the main platform for users to access and create information. Current retrieval in microblog mainly depends on the keyword matching rather than semantic analysis, which makes the results can' t satisfy user' s demand. To overcome this problem, we proposed a method for microblog semantic retrieval based on HowNet. Firstly, we used HowNet to conduct semantic relevance computation between query term and microblog terms on Chinese corpora. Then, the microblog texts containing terms with high degree of correlation were returned. Finally, we conducted experiments on Sina Microblog. The experimental results show that our method can obtain high accuracy on semantic level, and achieve better retrieval results.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报科学》
  • 北大核心期刊(2011版)
  • 主管单位:国家教育部
  • 主办单位:中国科学技术情报学会 吉林大学
  • 主编:靖继鹏
  • 地址:长春市人民大街5988号
  • 邮编:130022
  • 邮箱:infosci@jlu.edu.cn
  • 电话:0431-85095200
  • 国际标准刊号:ISSN:1007-7634
  • 国内统一刊号:ISSN:22-1264/G2
  • 邮发代号:12-174
  • 获奖情况:
  • 全国中文核心期刊,2001年被评为吉林省科技类一级期刊
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:36930