位置:成果数据库 > 期刊 > 期刊详情页
一种基于成分的句子相似度计算
  • ISSN号:1673-629X
  • 期刊名称:《计算机技术与发展》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]安徽大学计算机科学与技术学院,安徽合肥230039
  • 相关基金:安徽省自然科学基金资助项目(11040606M133)
中文摘要:

当前信息数据量庞大、冗余度高,如何在自动问答系统中快速查询所需要的信息成为一个关键课题。句子相似度计算作为该领域的一个基础并且是核心的部分,一直受到人们的关注。当前的方法各有其不足之处,文中提出了一种基于成分的句子相似度计算方法。通过将句子划分为主语、谓语、宾语、定语等成分,根据知网计算各个成分间的相似度,最后将所有成分的相似度加权求和得到句子相似度。这种方法不仅能够明显提高句子相似度计算的准确率,同时也极大地降低了计算时的时空消耗,可以有效地提高自动问答系统的准确性。

英文摘要:

The current information data has large high redundancy, how to find fast the information needed in automatic question answer- ing system has become a key issue. Sentence similarity calculation as the field of the foundation and the core part,has got the attention of people. In this paper, propose a new method which is based on the composition of sentence. Divide the sentence into subject, predicate, object,attribute and other parts. Calculate the similarity weight between corresponding parts according to HowNet,and the sentence simi- larity is the summation of all the weight above by some proportion. It not only significantly improves the accuracy of sentence similarity calculation,but also greatly reduces the calculation time and space consumption,and it can effectively improve the accuracy of the auto marie question answering system.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机技术与发展》
  • 中国科技核心期刊
  • 主管单位:陕西省工业和信息化厅
  • 主办单位:陕西省计算机学会
  • 主编:王守智
  • 地址:西安市雁塔路南段99号
  • 邮编:710054
  • 邮箱:ctad@vip.163.com
  • 电话:029-85522163
  • 国际标准刊号:ISSN:1673-629X
  • 国内统一刊号:ISSN:61-1450/TP
  • 邮发代号:52-127
  • 获奖情况:
  • 《CAJ-CD规范》执行优秀期刊
  • 国内外数据库收录:
  • 中国中国科技核心期刊
  • 被引量:21263