位置:成果数据库 > 期刊 > 期刊详情页
一种中医名词术语自动抽取方法
  • ISSN号:1003-0077
  • 期刊名称:《中文信息学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]沈阳航空航天大学知识工程研究中心,辽宁沈阳110136
  • 相关基金:国家重点基础研究发展计划项目(项目编号:2010CB530401)
中文摘要:

针对中医领域,提出了一种基于条件随机场的术语抽取方法,该方法将中医领域术语抽取看作一个序列标注问题,将中医领域术语分布的特征量化作为训练的特征,利用CRF工具包训练出一个领域术语模型,然后利用该模型进行术语抽取。选择《名医类案》作为中医领域文本进行术语抽取实验,取得了较好的效果,准确率为83.11%,召回率为81.04%,F-值为82.06%。

英文摘要:

This paper introduces a Conditional Random Fields (CRF) based method for term extraction in Traditional Chinese Medical(TCM). This method, taking the field term extraction as an issue of sequence marking, quantitates the characters of field term distribution as the training characters, leverages the CRF toolkit to generate a field term model and uses the model for field term extraction. With Classified Medical Records of Distinguished Physicians as its test materials, the experiment results in 83. 11% precision rate, 81.04% recall rate, and 82.06% F-measure.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136