东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

面向自然语言文本的否定性与不确定性信息抽取

ISSN号：1000-9825
期刊名称：《软件学报》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：苏州大学计算机科学与技术学院,江苏苏州215006
相关基金：国家自然科学基金（61272260,61331011,61273320）

关键词：信息抽取, 否定性信息, 不确定性信息, 线索词检测, 覆盖域界定, information extraction, negation information, uncertainty information, cue detection, scope resolution

中文摘要：

目前,信息抽取研究主要面向肯定性信息,而自然语言文本中包含了大量否定性和不确定性信息,为了将此类信息与肯定性信息区分开,有必要针对否定性与不确定性信息抽取进行深入研究.针对这一任务,首次构建了一个16841句的汉语语料资源,利用序列标注模型与卷积树核模型,系统地探索了各种序列化依存特征和结构化句法树特征的有效性,并提出了元决策树模型,对二者进行融合.实验结果显示,该方法在否定性和不确定性信息抽取任务上的精确率分别达到69.84%和58.57%,为相关研究打下了坚实的基础.

英文摘要：

The current research on information extraction mainly focuses on affirmative information. However there are more negation and uncertainty information in natural language texts. For purpose of separating them from affirmative information, it is necessary to make an intensive study of negation and uncertainty information extraction. For this task, this study firstly constructs a Chinese corpus including 16 841 sentences. Employing the sequence labeling model and the convolution tree kernel model, it systematically explores the efficiency of various kinds of serialized dependency features and structured parsing features. Finally, it proposes a meta-decision tree model to integrate the above two models. Experimental results show that the performances of the new method on negation and uncertainty information extraction achieve 69.84% and 58.57% of accuracy respectively, providing a solid foundation for related studies in the future.

同期刊论文项目

跨语言社会舆情分析基础理论与关键技术研究

期刊论文 21

自然语言处理中的覆盖域界定和聚焦点识别研究

期刊论文 18

汉语篇章结构分析的资源建设与计算模型研究

期刊论文 23

同项目期刊论文

中文事件事实性信息语料库的构建方法

自然语言处理中的篇章主次关系研究

基于语义分布相似度的翻译模型领域自适应研究

面向框架语义分析的目标词自动识别方法

面向半监督中文事件抽取的事件推理方法

基于语义场景的隐式篇章关系检测方法

基于全局搜索和局部分类的特定领域双语网站识别方法

基于外联关系的隐式篇章关系推理

面向满意度预测的滑鼠行为量化分析方法

平行推理机制：一种隐式篇章关系检测方法

利用框架语义知识优化事件抽取

基于HITS算法的双语句对挖掘优化方法

Research on Chinese negation and speculation： corpus annotation and identification

中文文学作品中的社会网路抽取与分析

自动关键词抽取研究综述

衔接性驱动的篇章一致性建模研究

基于跨场景推理的事件关系检测方法

基于双语信息和标签传播算法的中文情感词典构建方法

基于情绪相关事件上下文的隐含情绪分类方法研究

基于PDTB的自动显式篇章分析器

汉语显式篇章关系分析

基于多类型文本的半监督性别分类方法研究

基于机器翻译的双语协同关系抽取

基于主动学习的新闻读者情绪分类方法

基于问题与答案联合表示学习的半监督问题分类方法

复合名词短语N1AN2中形容词语义指向的判定与分析

基于有监督学习方法的多文档文本情感摘要

《世说新语》的篇章连接词

中文文学作品中的社会网路抽取与分析

自动关键词抽取研究综述

基于序列标注模型的情绪原因识别方法

汉英篇章结构平行语料库的对齐标注研究

衔接性驱动的篇章一致性建模研究

基于语料库的动态词群建构

添加冒号和分号分类标签特征的汉语逗号分类

汉英篇章结构平行语料库的对齐标注评估

汉语复句关系的特征结构

维吾尔语多词领域术语的自动抽取

细粒度意见挖掘中维吾尔语文本情感分析研究

基于深度置信网络的维吾尔语人称代词待消解项识别

基于多类型文本的半监督性别分类方法研究

基于机器翻译的双语协同关系抽取

基于主动学习的新闻读者情绪分类方法

基于问题与答案联合表示学习的半监督问题分类方法

面向专题检测的主题与社群联合聚类模型

维吾尔语比较句识别研究

混合策略的汉维辅助翻译系统的设计与实现

基于深度学习的维吾尔语人称代词指代消解

汉语篇章微观话题结构建模与语料库构建

汉维时间数字和量词的识别与翻译研究

基于MLN的中文事件触发词推理方法

基于全局优化的中文事件同指消解方法

深度学习的维吾尔语语句隐式情感分类

基于深度学习的维吾尔语语句情感倾向分析

面向自然语言处理的深度学习研究

基于语义的中文事件触发词抽取联合模型

使用全局优化方法识别中文事件因果关系

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609