位置:成果数据库 > 期刊 > 期刊详情页
基于语言规则的病症菌实体抽取
  • ISSN号:1671-8836
  • 期刊名称:《武汉大学学报:理学版》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]武汉科技大学计算机科学与技术学院,湖北武汉430065, [2]智能信息处理与实时工业系统湖北省重点实验室,湖北武汉430065
  • 相关基金:国家自然科学基金(61100133); 国家社会科学基金重大项目(11&Z189)资助项目
中文摘要:

实体抽取在自然语言处理领域中已经相当成熟;随着电子医疗文本急剧增加,医疗实体抽取在医疗领域的应用越来越受到关注.然而,针对医疗领域的专业术语,通用实体抽取方法普遍存在准确率不高的问题.针对药品说明书中的疾病、症状和致病菌,本文采用语言规则的方法,对其进行抽取并评价其准确性.首先,根据已有的术语表分词、词性标注并进行实体抽取;其次,根据语言规则识别医疗实体,从而提高实体抽取的准确率.实验结果显示各类医疗实体抽取的准确率可达80%以上.

英文摘要:

The entity extraction has already been quite mature in the area of natural language processing. With the dramatic increase of electronic medical texts,more and more attention have been paid on the applications of medical entity extraction in the medical field. However,for the terminology in the medical field,the accuracy of generic entity extraction is not high. This paper uses the method of linguistic rules to extract diseases,symptoms and pathogens in dispensatory and evaluate the accuracy of the system. According to the existing vocabulary,part of speech tagger will conduct the initial entity extraction. And then,the medical terminology will be enriched by the linguistic rules,so it can further improve the accuracy of the medical entity extraction. The experimental results show that the accuracy of medical entities,such as diseases,symptoms and pathogens,is more than 80% and the approach proposed by this paper is efficient and effective.

同期刊论文项目
期刊论文 27 会议论文 11 著作 1
同项目期刊论文
期刊信息
  • 《武汉大学学报:理学版》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国2教育部
  • 主办单位:武汉大学
  • 主编:刘经南
  • 地址:湖北武昌珞珈山
  • 邮编:430072
  • 邮箱:whdz@whu.edu.cn
  • 电话:027-68756952
  • 国际标准刊号:ISSN:1671-8836
  • 国内统一刊号:ISSN:42-1674/N
  • 邮发代号:38-8
  • 获奖情况:
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,英国动物学记录,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:6988