位置:成果数据库 > 期刊 > 期刊详情页
一种基于WordNet的短文本语义相似性算法
  • ISSN号:0372-2112
  • 期刊名称:电子学报
  • 时间:2012.3.15
  • 页码:617-620
  • 分类:TP16[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]吉林大学计算机科学与技术学院,吉林长春130012, [2]吉林大学符号计算与知识工程教育部重点实验室,吉林长春130012
  • 相关基金:国家自然科学基金项目资助(No.61175023,No.60903097)
  • 相关项目:人脸与虹膜信息融合识别新方法研究
中文摘要:

短文本语义相似性计算在文献检索、信息抽取、文本挖掘等方面应用日益广泛.本文提出了一种短文本语义相似性计算算法ST-CW.此算法使用WordNet和Brown文集来计算文本中的概念相似性,在此基础上提出了一个新的方法综合考虑概念、句法等信息来计算短文本的语义相似性.在R&B及Miller数据集上进行实验,实验结果验证了算法的有效性.

英文摘要:

The algorithm for semantic similarity of short text is used widely in document retrieval,information extraction and text mining.An algorithm for semantic similarity of short text named ST-CW is presented.The algorithm calculates semantic similarity of concept based on WordNet and The Brown Corpus,and then a formula is presented which refers to both concept similarity and syntactic information in short text.The evaluations are conducted on RB and Miller dataset.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电子学报》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国电子学会
  • 主编:郝跃
  • 地址:北京165信箱
  • 邮编:100036
  • 邮箱:new@ejournal.org.cn
  • 电话:010-68279116 68285082
  • 国际标准刊号:ISSN:0372-2112
  • 国内统一刊号:ISSN:11-2087/TN
  • 邮发代号:2-891
  • 获奖情况:
  • 2000年获国家期刊奖,2000年获国家自然科学基金志项基金支持,中国期刊方阵“双高”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:57611