东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

语料对中文名词短语指代消解影响研究

ISSN号：1003-0077
期刊名称：中文信息学报
时间：2013.5.5
页码：61-68
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]苏州大学计算机科学与技术学院,江苏省计算机信息处理技术重点实验室,江苏苏州215006
相关基金：国家自然科学基金资助项目（90920004,60970056,61070123,61003153）;江苏省高校自然科学重大基础研究资助项目（08KJA520002）
相关项目：汉语篇章衔接性分析：指代、省略及其消歧研究

作者：高俊伟|高俊伟|孔芳|孔芳|朱巧明|朱巧明|李培峰|李培峰|

关键词：指代消解, 名词短语, 无监督, 聚类, 语料, coreference resolution, noun phrase, unsupervised, clustering, corpus

中文摘要：

指代是自然语言中一种常见的语言现象，对简化语言，减少冗余有很大的作用。指代消解是用计算机找出这些指代现象的一个过程。近几年英文指代消解研究取得了很大的成就，然而，中文指代消解研究目前还较少，一方面是由于中文自然语言处理的研究起步较晚，相关的知识较少，另外一方面就是中文相关的语料库较少，目前已知的仅有ACE2005，OntoNotes等。为了探讨语料库对中文名词短语指代消解的影响，该文实现了一个基于有监督学习方法的中文名词短语指代消解平台和一个基于无监督聚类方法的中文名词短语指代消解平台，在此平台的基础上从语料库的数量和质量两个方面来探讨语料对中文名词短语指代消解的影响。

英文摘要：

Coreference is a common phenomenon in natural language, with a great effect in making the natural lan- guage clear and explicit illusions. Coreference resolution is the process to detect these phenomena by the computer. A great deal of research has been conducted on this task in English with substantial achievements in recent years. However, much less work has been done in this area in Chinese. One problem is the lack of public Chinese corpus for this research in except for ACE2005, OntoNotes and so on. To discuss the effect of the corpus to the Chinese Noun Phrase Anaphora Resolution, we present a Chinese noun phrase coreference resolution system that based on supervised learning approach and another system that based on unsupervised clustering approach. We discussed the effect of the corpus to the Chinese noun phrase coreference resolution based on the two platforms from the quantity and the quality of the corpus.

同期刊论文项目

多文档事件信息融合方法的研究

期刊论文 26 会议论文 13 专利 6

基于句法结构和语义信息的指代消解研究

期刊论文 25 会议论文 13 专利 1

中文句法分析与语义角色标注的联合学习机制研究

期刊论文 48 会议论文 7 专利 2

汉语篇章衔接性分析指代、省略及其消歧研究

期刊论文 4 会议论文 4

基于配价结构和话题结构的汉语句法分析和语义计算模型研究

期刊论文 52 会议论文 32 获奖 2

同项目期刊论文

基于集成学习的半监督情感分类方法研究

基于跨事件理论的缺失事件角色填充研究

语义分析与词频统计相结合的中文文本相似度量方法研究

基于网页文本依存特征的人名消歧

基于CRFs和跨事件的事件识别研究

一种基于LDA模型的主题句抽取方法

Using compositional semantics and discourse consistency to improve Chinese trigger identification

Improving Syntactic Parsing of Chinese with Empty Element Recovery

中文事件事实性信息语料库的构建方法

不平衡情感分类中的特征选择方法研究

基于情绪词的非监督中文情感分类方法研究

基于评价对象类别的跨领域情感分类方法研究

基于ＳＶＭ的中文名词短语指代消解研究

细粒度科技论文摘要句子分类方法

无监督中文名词短语指代消解研究

基于查询扩展的人名消歧

基于情绪词与情感词协作学习的情感分类方法研究

基于不平衡数据的中文情感分类

基于状态和行为描述的情感分类方法

面向半监督情感分类的特征选择方法研究

依存信息在蛋白质关系抽取中的作用

基于集成学习的半监督情感分类方法研究

一种基于LDA模型的主题句抽取方法

基于机器学习方法的事件指代消歧研究

Learning Noun Phrase Anaphoricity in Coreference Resolution via Label Propagation

指代消解中代词待消解项识别研究

基于可信度模型的中文人名识别研究

基于树核函数的中文零指代项识别研究

基于树核函数的“it”待消解项识别研究

基于规则的中文零指代项识别研究

基于树核函数的中英文代词消解

中英文指代消解中待消解项识别的研究

基于规则的中文缺省识别研究

基于SVM的中文名词短语指代消解研究

基于不平衡数据的中文情感分类

基于机器学习方法的英文事件代词消解研究

基于PDTB的自动显式篇章分析器

基于双语依存关系映射的中英文词表构建研究

用于中文缺省识别研究的机器学习方法

基于PDTB的自动显式篇章分析器

中文名词性谓词语义角色标注

基于卷积树核的无指导中文实体关系抽取研究

基于树核的隐式篇章关系识别研究

Kernel-Based Semantic Relation Detection and Classification via Enriched Parse Tree Structure

基于集成学习的半监督情感分类方法研究

基于平行论元的隐式篇章关系推理研究

基于线索树双层聚类的微博话题检测

基于功能连接词的隐式篇章关系推理

一种无指导的隐式篇章关系推理方法研究

语义分析与词频统计相结合的中文文本相似度量方法研究

一种基于LDA模型的主题句抽取方法

基于情绪词的非监督中文情感分类方法研究

基于可信度模型的中文人名识别研究

基于核心词和实体推理的事件关系识别方法

话题跟踪中静态和动态话题模型的核捕捉衰减

一种新型最优检索结果的发现与论证

基于全局用户意图的评论自动估价方法研究

基于不平衡数据的中文情感分类

基于树核的隐式篇章关系识别

基于动态自适应语言模型的中文输入系统的设计与实现

一种基于改进的K-means算法的人名消歧系统的设计与实现

一个基于分层的网页文本过滤系统

基于IP Queue的实时网页过滤系统的设计与实现

基于条件随机场的无监督中文词性标注

一种基于特征的程序可并行点发现方法

一种改进的TFIDF网页关键词提取方法

基于树核函数的中文语义角色分类研究

一种基于二元模型的分层文本过滤方法

一种基于LDA和上下文摘要的Web人名消歧方法

Linux平台下基于SCIM的中文输入法设计与实现

事件信息抽取中的数据预处理方法研究

基于IPQueue实时网页还原系统的设计与实现

基于质心迁移的领域适应性情感分类

一种面向主题的关键词查询扩展方法

基于IPQueue的即时通信协议还原系统的设计与实现

中文语义角色标注的树核空间研究

面向冗余度控制的中文多文档自动文摘

英语语篇结构分析研究综述

事件关系检测的语言学资源、评测及研究综述

中文名词性谓词语义角色标注

基于卷积树核的无指导中文实体关系抽取研究

Kernel-Based Semantic Relation Detection and Classification via Enriched Parse Tree Structure

依存信息在蛋白质关系抽取中的作用

基于集成学习的半监督情感分类方法研究

基于功能连接词的隐式篇章关系推理

一种基于LDA模型的主题句抽取方法

Learning Noun Phrase Anaphoricity in Coreference Resolution via Label Propagation

基于可信度模型的中文人名识别研究

基于树核函数的中英文代词消解

Tree kernel-based protein-protein interaction extraction from biomedical literature

基于双语约束的蒙古语无监督依存分析

最大熵和规则相结合的藏文句子边界识别方法

中英文指代消解中待消解项识别的研究

Toward a unified framework for standard and update multi-document summarization

话题跟踪中静态和动态话题模型的核捕捉衰减

一种新型最优检索结果的发现与论证

基于不平衡数据的中文情感分类

基于机器学习方法的英文事件代词消解研究

基于语义场景的隐式篇章关系检测方法

平行推理机制：一种隐式篇章关系检测方法

基于树核的隐式篇章关系识别

基于单文本指代消解的人物家庭网络构建研究

基于HITS算法的双语句对挖掘优化方法

基于动态自适应语言模型的中文输入系统的设计与实现

一种基于改进的K-means算法的人名消歧系统的设计与实现

一个基于分层的网页文本过滤系统

基于IP Queue的实时网页过滤系统的设计与实现

一种基于特征的程序可并行点发现方法

一种改进的TFIDF网页关键词提取方法

基于树核函数的中文语义角色分类研究

一种基于二元模型的分层文本过滤方法

一种基于LDA和上下文摘要的Web人名消歧方法

Linux平台下基于SCIM的中文输入法设计与实现

基于IPQueue实时网页还原系统的设计与实现

基于质心迁移的领域适应性情感分类

一种面向主题的关键词查询扩展方法

基于IPQueue的即时通信协议还原系统的设计与实现

英语语篇结构分析研究综述

基于双语依存关系映射的中英文词表构建研究

基于机器翻译的跨语言关系抽取

《同义词词林》在中文实体关系抽取中的作用

基于跨场景推理的事件关系检测方法

依存树到串模型中引入双语短语的三种方法

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136