位置:成果数据库 > 期刊 > 期刊详情页
一种基于领域本体的药品研发信息抽取方法
  • ISSN号:1002-1965
  • 期刊名称:情报杂志
  • 时间:2012.12.18
  • 页码:130-134+64
  • 分类:G353[文化科学—情报学]
  • 作者机构:[1]湖南大学工商管理学院,长沙410079
  • 相关基金:国家自然科学基金湖南大学青年教师基金项目“基于语义的上市公司年报文本信息质量测度方法及应用”(编号:71201052).
  • 相关项目:基于语义的上市公司年报文本信息质量测度方法及应用
中文摘要:

以生物医药公司年度报告为载体,设计了一种基于领域本体的信息抽取方法获取药品研发信息。首先依据药品研发固有的基本流程构建了领域本体词典,在对样本文档进行预处理的基础上介绍了时间词和否定词的处理;然后基于映射原理并结合触发机制、继承机制和选择机制,抽取并规范化药品研发信息;最后对抽取结果进行了查准率和查全率分析,证明了信息抽取方法的有效性。

英文摘要:

Taking annual report as a carder, this paper proposes an information extraction method for biological companies' drugs R&D in- formation based on domain ontology. First, the domain ontology dictionaries according to the basic process of drugs R&D is constructed and the process of times words and negative words after preprocessing the sample PDF documents is introduced in detail. Then, extracting and normalizing drugs R&D information are done by using mapping principle as well as trigger, inheritance, and selection mechanisms. Fi- nally, computing precision ratio and recall ratio based on the results of information extraction proves the validity of the method.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报杂志》
  • 北大核心期刊(2011版)
  • 主管单位:陕西省科学技术厅
  • 主办单位:陕西省科学技术信息研究所
  • 主编:薇子
  • 地址:西安市雁塔路南段99号
  • 邮编:710054
  • 邮箱:qbzz@263.net
  • 电话:029-85529749
  • 国际标准刊号:ISSN:1002-1965
  • 国内统一刊号:ISSN:61-1167/G3
  • 邮发代号:52-117
  • 获奖情况:
  • CSSCI来源期刊、中文核心期刊
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:43855