东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

集成多种背景语义知识的共指消解

ISSN号：1003-0077
期刊名称：《中文信息学报》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]哈尔滨工业大学信息检索研究室,黑龙江哈尔滨150001
相关基金：国家自然科学基金资助项目（60575042,60503072）;国家863计划资助项目（2006AA01Z145）

作者：郎君[1], 忻舟[1], 秦兵[1], 刘挺[1], 李生[1]

关键词：计算机应用, 中文信息处理, 共指消解, 背景语义知识, WORDNET, 维基百科, computer application, Chinese information processing, coreference resolution, background knowledge WordNet , wikipedia

中文摘要：

共指消解是信息抽取中一个重要子任务。近年来,许多学者尝试利用统计机器学习的方法来进行共指消解并取得了一定的进展。背景知识作为新的研究热点已经被越来越多地利用在自然语言处理的各个领域。该文集成多种背景语义知识作为基于二元分类的共指消解框架的特征,分别在WordNet、维基百科上提取背景知识,同时利用句子中的浅层语义关系、常见文本模式以及待消解词上下文文本特征。并利用特征选择算法自动选择最优的特征组合,同时对比同样的特征下最大熵模型与支持向量机模型的表现。在ACE数据集上实验结果表明,通过集成各种经过特征选择后的背景语义知识,共指消解的结果有进一步提高。

英文摘要：

The coreference resolution is an important subtask of information extraction. Recently statistical machine learning methods have been substantially attempted for this issue with some achievements. In this paper, we try to integrate the background semantic knowledge, which is a new subject being introduced in every field of NLP nowadays, into the classical pairwise classification framework for coreference resolution. We extract background knowledge from WordNet and Wikipedia, and exploit the semantic role labeling, general pattern knowledge and the context of mention as well. In the experiment, the feature selection algorithm is employed to decide the best features set, on which the maximum entropy model and SVM model are compared for their performance. The experimental results on ACE dataset exhibit the improvement of coreference resolution after adding selected background semantic knowledge.

同期刊论文项目

中文短语及简单句的复述技术研究

期刊论文 38 会议论文 15

基于等价伪词的汉语全文无指导词义消歧技术研究

期刊论文 33 会议论文 15

　基于XML的分层交互式中文处理开放平台

期刊论文 6

同项目期刊论文

短语结构树库向依存结构树库转化研究

统计词义消歧的研究进展

基于无指导机器学习的全文词义自动标注方法

复述技术研究综述

基于词汇支配度的汉语依存分析模型

Building a Dependency Treebank for Improving Chinese Parser

2005 年 863 信息检索评测哈尔滨工业大学信息检索研究室技术报告

基于语言模型验证的词义消歧语料获取

句法与词义相结合的中文代词消解

中文事件抽取技术研究

句法与词义结合的中文代词消解

基于层次聚类的自适应信息过滤学习算法

基于网络挖掘的实体关系元组自动获取

SUBDIVIDING VERBS TO IMPROVE SYNTACTIC PARSING

基于双语语料库的短语复述实例获取研究

话题检测与跟踪的评测及研究综述

一种基于主题的文本聚类方法

中文语义角色标注的特征工程

基于最大熵分类器的语义角色标注

基于信息增益改进贝叶斯模型的汉语词义消歧

基于网络挖掘的上下文相关词汇级复述研究

基于SVM的汉语句子片段划分

2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告

BOOTSTRAPPING FOR EXTRACTING RELATIONS FROM LARGE CORPORA

复述技术研究综述

基于词汇支配度的汉语依存分析模型

基于人工标注的个性化检索系统评测的研究

面向协作式问答的问题理解技术研究

Intra-document Coreference Resolution: The state of the art

基于子话题分治匹配的新事件检测

基于语义域语言模型的中文话题关联检测

信息过滤中基于二元近似关系分布的噪声屏蔽算法

句法与词义相结合的中文代词消解

中文人称名词短语单复数自动识别

基于层次聚类的自适应信息过滤学习算法

基于网络挖掘的实体关系元组自动获取

SUBDIVIDING VERBS TO IMPROVE SYNTACTIC PARSING

基于双语语料库的短语复述实例获取研究

话题检测与跟踪的评测及研究综述

一种基于主题的文本聚类方法

中文语义角色标注的特征工程

基于最大熵分类器的语义角色标注

基于网络挖掘的上下文相关词汇级复述研究

2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告

基于线索词识别和训练集扩展的中文问题分类

基于ontology抽取优化初始选择的检索结果聚类

BOOTSTRAPPING FOR EXTRACTING RELATIONS FROM LARGE CORPORA

基于话题和修辞识别的阅读理解why型问题回答

基于语言模型验证的词义消歧语料获取

基于启发式错误驱动学习的中文时间表达式识别

信息过滤中基于二元近似关系分布的噪声屏蔽算法

基于线索词识别和训练集扩展的中文问题分类

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136