位置:成果数据库 > 期刊 > 期刊详情页
基于特征耦合泛化的药名实体识别
  • ISSN号:1003-0077
  • 期刊名称:《中文信息学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]大连理工大学计算机科学与技术学院,辽宁大连116024, [2]山东省农业管理干部学院机械电子工程系,山东济南250100
  • 相关基金:国家自然科学基金(61070098,60973068,61272373);高等学校博士学科点专项科研基金(20090041110002);中央高校基本科研业务费专项资金资助项目(DUT10JS09);辽宁省博士启动基金资助项目(20091015)
中文摘要:

药名识别的直接目的是从生物医学文本中寻找药名.目前,药物相关研究不断出现,远远超出了维护人员更新药物信息数据库的速度,这就迫切需要一种自动提取药物信息的技术.该文采用了一种基于特征耦合泛化(FCG)的半监督学习方法生成药名词典,然后将药名词典和条件随机场结合进行药名实体识别.首先我们用模板的方法构造了一个药名词典,然后用FCG方法对词典去噪,最后将去噪后的词典用在测试集上进行药名实体识别,得到了76.73%的F值.

英文摘要:

Drug name recognition aims to find drugs in biomedical texts, which is a demanding technology in face of overwhelming drug researches. We adopt a semi-supervised learning method to build a dictionary and then use the combination of the dictionary and the Condition Random Field method to recognize the drug name entities. Firstly, we extract a drug name dictionary using template matching method and then Feature Coupling Generalization (FCG) is used to filter the dictionary. Finally, we combine the dictionary and the Condition Random Field method to recog- nize the drug entities. As a result, our method achieved an F-score of 0. 767 3 on the drug name recognition corpus.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《中文信息学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国中文信息学会 中国科学院软件研究所
  • 主编:孙茂松
  • 地址:北京海淀中关村南四街4号中科院软件所
  • 邮编:100190
  • 邮箱:jcip@iscas.ac.cn
  • 电话:010-62562916
  • 国际标准刊号:ISSN:1003-0077
  • 国内统一刊号:ISSN:11-2325/N
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:9136