位置:成果数据库 > 期刊 > 期刊详情页
基于启发式错误驱动学习的中文时间表达式识别
  • ISSN号:1002-0470
  • 期刊名称:高技术通讯
  • 时间:0
  • 页码:1258-1262
  • 语言:中文
  • 分类:TP391.41[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术] TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
  • 相关基金:863计划(2006AA01Z145)和国家自然科学基金(60435020,60675034)资助项目.
  • 相关项目:汉语语义角色标注方法研究
中文摘要:

提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法。该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注,采用启发式A*算法搜索策略进行错误驱动学习,降低了规则学习的复杂度,并具有区分每条规则的有效性和规则间相容性的优点,使系统性能提高近6%。最终在封闭测试集和开放测试集上,F值分别达到了77.96%和77.92%。

英文摘要:

This paper proposes a new method tor recognizing Chinese time expression based on the heuristic error-driven learning. The method begins with a time trigger word to recognize the time expressions regressively using the dependency parsing, so it resolves the problem of long distance dependency effectively and improves the system performance greatly. Based on this, it uses the error-driven learning integrating the A^* algorithm to heuristically learn the rules, which not only decreases the complexity of learning rides, but also differentiates the validity of each rule and compatility among rules, resulting in an increase of 6% in system performance. Finally, it creats the F values of 77.96% and 77.92% on the closed test and the open test respectively.

同期刊论文项目
期刊论文 29 会议论文 12
同项目期刊论文
期刊信息
  • 《高技术通讯》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国科学科技部
  • 主办单位:中国科学技术信息研究所
  • 主编:赵志耘
  • 地址:北京市三里河路54号
  • 邮编:100045
  • 邮箱:hitech@istic.ac.cn
  • 电话:010-68514060 68598272
  • 国际标准刊号:ISSN:1002-0470
  • 国内统一刊号:ISSN:11-2770/N
  • 邮发代号:82-516
  • 获奖情况:
  • 《中国科学引文数据》刊源,《中国科技论文统计与分析》刊源
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘
  • 被引量:12178