位置:成果数据库 > 期刊 > 期刊详情页
基于层叠条件随机场的中文医疗机构名识别
  • ISSN号:1671-3559
  • 期刊名称:《济南大学学报:自然科学版》
  • 时间:0
  • 分类:TP3[自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]昆明理工大学信息工程与自动化学院,云南昆明650500, [2]昆明理工大学云南省计算机应用重点实验室,云南昆明650500
  • 相关基金:国家自然科学基金项目(81360230)
中文摘要:

针对目前中文医疗机构名识别问题,提出一种基于层叠条件随机场模型的中文医疗机构名识别方法;该方法第一层条件随机场(CRF)模型基于词粒度,结合自定义词典,实现人名、地名以及简单机构名识别,将最终的结果传递到第二层CRF模型;第二层CRF模型通过词性、词界以及上下文等特征最终完成对复合嵌套的医疗机构名实体的识别。结果表明:在封闭实验中,该方法识别正确率达到94.6%,召回率达到96.2%;在开放实验中,该方法识别正确率达到92.3%,召回率达到90.2%。本文模型相比于结合规则的单层CRF模型,F值分别提高1.99%、2.8%,总体结果得到显著改善。

英文摘要:

A method based on the cascade conditional random field model was proposed to solve the current problem of Chinese medical institution name recognition. The first layer of this method was about the random field conditional (CRF) model, it combined word size and a custom dictionary to recognize person names, place names and names of simple organizations, and then sent the results to the second layer of CRF model. The second layer of CRF model completed the entity recognition of the names of compositely nested medical institutions by the feature of speech, word boundary and context. In closed experiment, the correct recognition rate is 92.3 % and the recall rate is 90.2%. In open experiment, the correct recognition rate is 92.3% and the recall rate is 90.2%. Compared with the single layer CRF model combined with rules, the F-measure is increased by 1.99% and 2.8% respectively. The overall results are significantly improved.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《济南大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:山东省教育厅
  • 主办单位:济南大学
  • 主编:杜斌
  • 地址:济南市南辛庄西路336号
  • 邮编:250022
  • 邮箱:sdjc@ujn.edu.cn
  • 电话:0531-82765454
  • 国际标准刊号:ISSN:1671-3559
  • 国内统一刊号:ISSN:37-1378/N
  • 邮发代号:
  • 获奖情况:
  • 2006、2010年获中国高校优秀科技期刊奖,2004、2009年获全国高校科技期刊优秀编辑出版质量奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:4142