位置:成果数据库 > 期刊 > 期刊详情页
一种基于向量词序的句子相似度算法研究
  • ISSN号:1006-9348
  • 期刊名称:计算机仿真
  • 时间:2014
  • 页码:417-424
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]武汉科技大学信息科学与工程学院,湖北武汉430081, [2]武汉科技大学冶金自动化与检测技术教育部工程研究中心,湖北武汉430081
  • 相关基金:国家自然科学基金(61175094)
  • 相关项目:Multi-Agent架构智能机器人推理机实时性研究
中文摘要:

针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题。为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予更高的权重,同时,在向量空间模型的基础上,引入词序因子,计算句子词序相似度。使用包含6个领域的2651个句子作为语料库,实验结果表明,改进方法使特征领域内句子相似度计算的准确度得到提高。

英文摘要:

Traditional sentence similarity algorithms cannot achieve high accuracy of similarity calculation due to their low matching rate in the syntactic structure. This paper proposes an improved sentence similarity algorithm based on the word order of vector distance to improve the accuracy of similarity calculation. It improves from the text feature -weight and Chinese word order calculation. With the establishment of corresponding domain feature set, the feature item in the domain will be given a higher weight. At the same time, on the basis of the vector space model, word order factor is introduced for the similarity calculation of Chinese word order. With the corpus containing six areas of 2651 sentences, the experimental result shows that the proposed algorithm can increase the accuracy of similarity cal- culation within the domain.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机仿真》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科技科工集团公司
  • 主办单位:中国航天科工集团公司第十七研究所
  • 主编:吴连伟
  • 地址:北京市海淀区阜成路14号
  • 邮编:100048
  • 邮箱:jsjfz@compusimu;kwcoltd@public.bta.net.cn
  • 电话:010-59475138
  • 国际标准刊号:ISSN:1006-9348
  • 国内统一刊号:ISSN:11-3724/TP
  • 邮发代号:82-773
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:38378