位置:成果数据库 > 期刊 > 期刊详情页
语义蕴涵关系识别中的特征提取方法
  • ISSN号:0254-0037
  • 期刊名称:《北京工业大学学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]北京工业大学计算机学院,北京100124
  • 相关基金:国家自然科学基金资助项目(60803086); 北京市自然科学基金资助项目(4123091); 北京市属高等学校人才强教深化计划“中青年骨干人才培养计划”资助项目(PHR20110815)
中文摘要:

为了捕捉不同文本片段之间的语义推理结果,实现文本片段之间的推导,采用基于分类器的方法进行蕴涵关系的判断.特征的选取是影响分类器性能的关键因素,在采用基本的词汇特征的基础上,引入了句法特征以及语义特征.通过构建语义链的方法挖掘T和H之间的语义关联,并应用于不同的分类器检验语义特征的有效性.在公开评测的数据集RTE-3~RTE-5上评价系统的性能,AdaBoost与SVM分类器取得的准确率分别为61.0%和61.8%.t检验的结果表明:基于语义链的语义特征使得系统性能得到了显著的提高.

英文摘要:

To capture the semantic inference result between different text fragments and resolve the reasoning problem of the text fragments, the classifier method was adopted to implement the entailment decision and the feature selection was the important factor influencing the classifier performance. The lexical features were applied in the system as the baseline and then the syntactic feature and the semantic feature were joined. The construction of lexical chains could mine the semantic relation between T and H and it had been used on the classifier to verify its effectiveness. The system performance had been evaluated on the data set of RTE-3 - RTE-5. The classifier of AdaBoost and SVM achieved the higher precision of 61.0% and 61.8% , respectively. The t-test results indicate that the semantic feature based on the lexical chain makes the system performance improve significantly.

同期刊论文项目
期刊论文 19 会议论文 10
同项目期刊论文
期刊信息
  • 《北京工业大学学报》
  • 中国科技核心期刊
  • 主管单位:北京市教委
  • 主办单位:北京工业大学
  • 主编:卢振洋
  • 地址:北京市朝阳区平乐园100号
  • 邮编:100124
  • 邮箱:xuebao@bjut.edu.cn
  • 电话:010-67392535
  • 国际标准刊号:ISSN:0254-0037
  • 国内统一刊号:ISSN:11-2286/T
  • 邮发代号:2-86
  • 获奖情况:
  • 中国高等学校自然科学学报优秀学报二等奖,北京市优秀期刊,华北5省市优秀期刊,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:11924