位置:成果数据库 > 期刊 > 期刊详情页
基于语义扩展的句子相似度算法
  • ISSN号:0253-2395
  • 期刊名称:山西大学学报(自然科学版)
  • 时间:2015.8.15
  • 页码:399-405
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]西南交通大学信息科学与技术学院,成都611756, [2]DOCOMO Innovations公司,帕罗奥图美国94304
  • 相关基金:国家自然科学基金(No.61170111;61262058)
  • 相关项目:基于半监督学习的聚类集成机理及高效算法研究
中文摘要:

现有的句子相似度计算方法仅考虑句子的依存关系或者组成句子的词性、词序、词义等信息,没有考虑到整个句子的语义信息,文章提出了一种基于语义扩展的句子相似度计算方法,解决了句子相似度计算时忽略句子语义的问题。利用搜索引擎对句子语义扩展,从而将简短的句子转化为长文本,然后使用主题模型对长文本进行特征提取,即将句子的相似度计算转化为求两个句子的语义间的差别运算。实验结果表明,基于语义扩展的句子相似度计算准确率能达到87%,而且计算结果符合常识判断。

英文摘要:

Current sentence similarity computation algorithm only considered the part of speech,word order,semantic information,and did not consider the semantics implied by the sentence.Therefore,this paper presents a sentence similarity computing based on semantic extension which can solve the problem of ignoring the sentence semantic information.The search engine to extend short sentence knowledge is used,which can transform short sentence into a long text.And then the topic model to find real sentence's meaning is applied.As a result,the procedure of computing sentence similarity is transformed into the process of calculating the differences between the real semantics of two sentences.The experiment results show that the accuracy rate of sentence similarity computing based on semantic deep extension rises to 87%,what's more,calculation results are measured up to common sense judgments.

同期刊论文项目
期刊论文 66 会议论文 38 获奖 20 著作 4
同项目期刊论文
期刊信息
  • 《山西大学学报:自然科学版》
  • 北大核心期刊(2011版)
  • 主管单位:山西省教育厅
  • 主办单位:山西大学
  • 主编:杨斌盛
  • 地址:太原市坞城路92号
  • 邮编:030006
  • 邮箱:xbbjb@sxu.edu.cn
  • 电话:0351-7010455
  • 国际标准刊号:ISSN:0253-2395
  • 国内统一刊号:ISSN:14-1105/N
  • 邮发代号:22-42
  • 获奖情况:
  • 边疆七年获山西省一级期刊荣誉(1993-1999)
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),英国动物学记录,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:5651