位置:成果数据库 > 期刊 > 期刊详情页
基于加权语义网的文本相似度计算的研究
  • ISSN号:1002-1965
  • 期刊名称:《情报杂志》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]华南理工大学企业信息化与知识管理研究中心,广州510640
  • 相关基金:国家自然科学基金青年基金项目“基于多种知识网络集成的组织知识系统超网络模型研究”(编号:70801028);国家自然科学基金面向项目“基于服务管理的移动知识管理模型研究”(编号:70871043)
中文摘要:

基于词频统计思想的传统文本相似度算法,往往只考虑特征项在文本中的权重,而忽视了特征项之间的语义关系。综合考虑了特征项在文本中的重要程度以及特征项之间的语义关系,提出构建文本特征项的加权语义网模型来计算文本之间的相似度,并在模型构建的过程中,对特征项的选取、权值计算做了适当的改进。最后用实验验证了基于加权语义网的文本相似度算法相较于传统的算法,相似度计算的精确度有了进一步的提高。

英文摘要:

The traditional documents similarity algorithm based on the thought of statistical information of word frequency only considers the w eight of feature items in a document,thus ignores the semantic relations among feature items.This paper considers both the importance of feature items in a document and the semantic relations among feature items,and proposes to construct a w eighted semantic netw ork of document feature items to calculate the similarity of documents.In the process of constructing the model,there are some appropriate improvements in the selection of feature items and the calculation of feature items w eight.With an experiment,it is w ell-proved that,compared w ith the traditional algorithm,the suggested algorithm based on w eighted semantic netw ork promotes the precision of the calculation of documents similarity.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报杂志》
  • 北大核心期刊(2011版)
  • 主管单位:陕西省科学技术厅
  • 主办单位:陕西省科学技术信息研究所
  • 主编:薇子
  • 地址:西安市雁塔路南段99号
  • 邮编:710054
  • 邮箱:qbzz@263.net
  • 电话:029-85529749
  • 国际标准刊号:ISSN:1002-1965
  • 国内统一刊号:ISSN:61-1167/G3
  • 邮发代号:52-117
  • 获奖情况:
  • CSSCI来源期刊、中文核心期刊
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:43855