位置:成果数据库 > 期刊 > 期刊详情页
基于差异性和重要性的问句特征组合
  • ISSN号:0372-2112
  • 期刊名称:电子学报
  • 时间:2014
  • 页码:918-924
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南京大学计算机软件新技术国家重点实验室,江苏南京210023:, [2]安徽工业大学计算机学院,安徽马鞍山243002, [3]安徽工程大学机电学院,安徽芜湖241000
  • 相关基金:国家自然科学基金(No.61170181); 江苏省自然科学基金(No.BK2011192); 安徽省高校省级自然科学研究重点项目(No.KJ2011A048)
  • 相关项目:基于依存图的汉语依存分析技术研究
中文摘要:

在问答系统问句分类研究中,对问句特征进行组合有助于构造高效的问句分类器.针对当前问句分类中的特征组合问题,提出一种基于差异性和重要性的特征组合(Diversity and Importance based Feature Combination,DIFC)方法.通过计算待组合特征与当前特征组合的错分差异度和正分差异度,以及待组合特征本身的重要度,从候选特征集中动态获取优化的特征组合.在哈工大中文问句集上对词袋绑定特征进行组合的实验结果表明,与其他特征组合方法相比,DIFC方法灵活高效,准确率更高.

英文摘要:

In research on question classification in question answering system, combining features can greatly help construct efficient question classifier. In order to deal with the problem of low performance of existing methods, a new method of diversity and importance based feature combination(DIFC) is proposed. By calculating the diversity between candidate feature and current combination for error and correct classification respectively, and the importance of candidate feature, features can be dynamically selected from candidate feature set. The experimental results of bag - of- words binding features on the HIT Chinese question set show that, compared with other methods, the new method is flexible and efficient, and gets more optimal feature combination.

同期刊论文项目
期刊论文 17 会议论文 10
同项目期刊论文
期刊信息
  • 《电子学报》
  • 中国科技核心期刊
  • 主管单位:中国科学技术协会
  • 主办单位:中国电子学会
  • 主编:郝跃
  • 地址:北京165信箱
  • 邮编:100036
  • 邮箱:new@ejournal.org.cn
  • 电话:010-68279116 68285082
  • 国际标准刊号:ISSN:0372-2112
  • 国内统一刊号:ISSN:11-2087/TN
  • 邮发代号:2-891
  • 获奖情况:
  • 2000年获国家期刊奖,2000年获国家自然科学基金志项基金支持,中国期刊方阵“双高”期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘,中国北大核心期刊(2000版)
  • 被引量:57611