东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于多标签CRF的疾病名称抽取

ISSN号：1001-3695
期刊名称：《计算机应用研究》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：武汉大学计算机学院,武汉430072
相关基金：国家自然科学基金重点资助项目（61133012）;国家哲学社会科学重大计划招标项目（11＆ZD189）;国家自然科学基金资助项目（61173062）

作者：王鹏远, 姬东鸿

关键词：命名实体识别, 条件随机场, 多标签, 医疗文本, 复合实体, named entity recognition, conditional random fields, multi-label, medical text, composite entity

中文摘要：

生物医疗文本中的命名实体识别对于构建和挖掘大型临床数据库以服务于临床决策具有重要意义,而其中一个基础工作是疾病名称的识别。医疗文本中存在大量的复合疾病名称,难以分离抽取出其中的实体。针对这一问题,提出一种基于多标签的条件随机场算法,首先对数据标注多层标签,每层标签针对复合疾病名称中的不同疾病,然后用整合后的最终标签去训练模型,最后再对模型预测的标签进行分离。此方法能够识别传统条件随机场算法无法识别的复合疾病名称,实验结果验证了所提算法的有效性。

英文摘要：

Named entity recognition in medical text for building and digging large clinical database to serve the clinical decision is of great significance, and one of the important basic work is to be able to accurately identify the name of the disease. There are a large number of compound disease name in the medical texts. In order to solve this problem, this paper proposed a kind of CRF algorithm based on multi-label, first of all, it put muhilayer labels to the data, labels on each floor for different diseases, and then integrated into an end label to training model, finally, it isolated each layer label from the model predicts result, and then identified the diseases. This method can recognize composite disease name which cannot be identified by the traditional CRF algorithm. The experimental results verify the effectiveness of the proposed algorithm.

同期刊论文项目

篇章级中文语义分析理论与方法

期刊论文 50

　基于本体演化和事件结构的语义网模型研究

期刊论文 71

汉语文本推理的资源建设和统计分析研究

期刊论文 36 会议论文 33

同项目期刊论文

基于PU学习算法的虚假评论识别研究

基于迁移的微博分词和文本规范化联合模型

基于卷积网络的句子语义相似性模型

一种分布式防火墙规则有效性检测算法

融入事件知识的主题表示方法

面向汽车领域的软文识别研究

中文篇章级句间关系自动分析

基于CRF和半监督学习的中文时间信息抽取

基于分析和生成的复述与SMT语料扩展

基于复杂网络重叠社团发现的微博话题检测

文本蕴涵研究现状和发展趋势

基于位置敏感Embedding的中文命名实体识别

基于事件卷积特征的新闻文本分类

基于无监督学习算法的推特文本规范化

基于神经网络模型的产品属性情感分析

中文微博情感倾向性分析特征工程

省略识别及恢复联合模型研究

基于OC-SVM的新情感词识别

中文复杂名词短语依存句法分析

基于SVM和CRF多特征组合的微博情感分析

一种面向社区型问句检索的主题翻译模型

文本可视化研究综述

社会媒体中用户的隐式消费意图识别

因果关系及其在社会媒体上的应用研究综述

一个基于超图的词义归纳模型

基于核特征的商品图像句子标注

基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例

使用过训练提升词性标注依存句法联合模型的速度

A Multiple Feature Approach for Disorder Normalization in Clinical Notes

面向网络文本的信息可信度评估方法研究

社会焦点透视镜系统——大数据视角下的舆情观测平台

基于网络结构的多种用户影响力分析算法对比研究

面向社会媒体的消费意图识别：任务、挑战与机遇

跨社区的用户链指技术综述

Generating Chinese named entity data from parallel corpora

基于自学习的汉语开放域命名实体边界识别

实体链指技术研究进展

基于边权重的主题核心术语抽取

中文篇章级句间语义关系识别

中文篇章级句间语义关系体系及标注

基于Folksonomy的本体构建综述

基于词语关联度的查询缩略

BUEES： a bottom-up event extraction system

借重于人工知识库的词和义项的向量表示：以HowNet为例

基于核特征和tag-rank的商品图像句子标注

统计与词典相结合的领域自适应中文分词

基于主动学习的中文依存句法分析

基于关键词精化和句法树的商品图像句子标注

面向产品评论分析的短文本情感主题模型

Multi-Document Extractive Summarization Using Event Semantic Relation Graph Clustering.

Event Graph Based Contradiction Recognition from Big Data Collection

基于短文本隐含语义特征的文本蕴涵识别

Finding deceptive opinion spam by correcting the mislabeled instances

基于协同训练的文本蕴含识别

基于半监督学习算法的虚假评论识别研究

Automatic Ontology Construction Based on Clustering Nucleus

基于信息单元融合的新闻原子事件抽取

基于知识话题模型的文本蕴涵识别

基于PU学习算法的虚假评论识别研究

基于图式的文本蕴涵识别初探

BioTSA: Annotating Token Semantic Association to Support Biomedical Text Mining

基于语义规则的中文矛盾关系识别方法

基于支持向量机的中文文本蕴涵识别研究

基于事件语义特征的中文文本蕴含识别

基于迁移的微博分词和文本规范化联合模型

基于卷积网络的句子语义相似性模型

基于CRF和半监督学习的中文时间信息抽取

文本蕴涵研究现状和发展趋势

基于无监督学习算法的推特文本规范化

基于SVM和CRF多特征组合的微博情感分析

一种联合抽取疾病、药物以及副作用事件的方法

基于事件链的汉语语篇连贯资源建设

面向产品评论分析的短文本情感主题模型

现代汉语非名词性空语类

词位重构与平行语言资源的再生性建设

Automatic Ontology Construction Based on Clustering Nucleus

基于信息单元融合的新闻原子事件抽取

基于知识话题模型的文本蕴涵识别

基于PU学习算法的虚假评论识别研究

题元角色理解与英语动词一词多义的认知与教学

Semantic Relation Annotation for Biomedical Text Mining Based on Recursive Directed Graph

微博关注网构建与统计分析研究

问答系统中基于维基百科的问题扩展技术研究

汉语语义场网络中的无标度分布现象

基于特征结构的汉语连动句语义标注研究

基于卷积网络的句子语义相似性模型

融入事件知识的主题表示方法

基于无监督学习算法的推特文本规范化

一个基于超图的词义归纳模型

移动互联环境下高等教育中的国情与省情教育面临的挑战和对策

一种联合抽取疾病、药物以及副作用事件的方法

一种基于GPU的并行三维各向异性扩散的超声图像斑点噪声滤波算法

基于列数据库和图缓存的海量RDF管理

基于句法分析的临床指南事件及事件关系提取

一种高密度关联数据压缩方案

基于事件指导的多文档生成式摘要方法

基于结构化事件的主题表示

基于矩阵分解和子模最大化的微博新闻摘要方法

融入显著性事件信息的标题生成方法

A Multiple Feature Approach for Disorder Normalization in Clinical Notes

基于知识图谱的精细化工辅助研发平台

基于事件链的汉语语篇连贯资源建设

文学典籍英译中的文化负载词问题思考——以《西游记》中的“相应”为例

谈谈显性非宾格动词句

隐性形式、扣合与句位变体——以“是……的”句的句位变体研究为例

基于语言现象的文本蕴涵识别

基于关键词精化和句法树的商品图像句子标注

副词“一定”的情态意义和相关功能研究

规则与统计相结合的主谓谓语句的日汉机器翻译研究

基于物性结构的事件演化语义模型

论语义阻碍在英语词位构成三个层面的表现

中文文本中实体数值型关系无监督抽取方法

基于概念特征的汉语交互类言说动词语义分析及同义词群的建构

中国古代岁时民俗文献研究

关于“是”字句主宾语的分析

现代汉语“数词＋名词”的事件语义及名词研究

中文美食开放链接资源库（LOD）建设实践

中文医学指南的事件处理及其语义数据自动生成

规约会话含义的意象图式理据

英汉多项状语并置语序差异的认知阐释——以工具、地点、频度和时间状语为例

表移动义“切”类动词的句法语义问题

基于事件结构的英语意动构式研究

SPES：基于谓词选择率估计的SPARQL查询优化方案

基于话题相关的文档集的无向基本要素网络的连通性探讨

基于图数据库的RDF数据分布式存储

一种基于本体的工业消防辅助调度系统实现

基于K值改进的K-means算法在入侵检测中的应用

“差一点”和“差不多”的语义差异及其认知解释

基于列式数据库的RDF数据分布式存储

重复图数据收缩清理策略

语言的隐显形式与“是……的”句的再分类

基于内容标签的消防知识推荐系统

基于论元结构和论元角色的英语-（a）tion型后缀动词名物词具体义研究

现代汉语评价类言说动词语义特征描写与义合网络的建构

Semantic Cache Replacement Strategy for XML Algebra-Based Query Optimization

符号学视角下京剧与歌舞伎脸谱对比研究——以关羽与源义经形象为例

面向产品评论分析的短文本情感主题模型

案例教学法指导下的商务日语教学改革方案——以商务礼仪教学为例

任务抢占策略在XML多核查询中的应用

义项归纳新探

基于任务抢占与数据分区的XML多核查询优化

基于中文自然语言的合理用药查询

语言学模因论指导下的日语多义词教学研究

期刊信息

《计算机应用研究》
北大核心期刊（2011版）

主管单位:四川省科学技术厅
主办单位:四川省计算机研究院
主编：刘营
地址：成都市成科西路3号
邮编：610041
邮箱：arocmag@163.com
电话：028-85210177 85249567

国际标准刊号：ISSN：1001-3695
国内统一刊号：ISSN：51-1196/TP
邮发代号:62-68

获奖情况:
第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:60049