东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

中文语义角色标注的特征工程

ISSN号：1003-0077
期刊名称：中文信息学报
时间：0
页码：79-84
语言：中文
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]哈尔滨工业大学信息检索实验室,黑龙江哈尔滨150001
相关基金：自然科学基金（60575042,60503072,60675034）
相关项目：汉语语义角色标注方法研究

作者：刘挺|刘怀军|车万翔|

关键词：计算机应用, 中文信息处理, 语义分析, 语义角色标注, 特征工程, 最大熵分类器, computer application, Chinese information processing, semantic parsing, semantic role labeling, feature engineering, maximum entropy classifier

中文摘要：

基于统计机器学习的语义角色标注在自然语言处理领域越来越受到重视，丰富多样的特征直接决定语义角色标注系统的性能。本文针对中文的特点。在英文语义角色标注特征的基础上，提出了一些更有效的新特征和组合特征：例如，句法成分后一个词、谓语动词和短语类型的组合、谓语动词类别信息和路径的组合等。并在Chinese Proposition Bank（CPB）语料数据上，使用最大熵分类器进行了实验，系统F-Score由89．76％增加到91．31％。结果表明，这些新特征和组合特征显著提高了系统的性能。因此，目前进行语义角色标注应集中精力寻找丰富有效的特征。

英文摘要：

In the natural language processing field, researchers have experienced a growth of interest in semantic role labeling by applying statistical and machine-learning methods. Using rich features is the most important part of semantic parsing system. In this paper, some new effective features and combination features are proposed, such as next word of the constituent, predicate and phrase type combination, predicate class and path combination, and so on. And then we report the experiments on the dataset from Chinese Proposition Bank （CPB）. After these new features used, the final system improves the F-Score from 89. 76% to 91. 31%. The results show that the performance of the system has a statistically significant increase. Therefore it is very important to find better features for semantic role labeling.

同期刊论文项目

中文短语及简单句的复述技术研究

期刊论文 38 会议论文 15

汉语语义角色标注方法研究

期刊论文 29 会议论文 12

基于等价伪词的汉语全文无指导词义消歧技术研究

期刊论文 33 会议论文 15

同项目期刊论文

短语结构树库向依存结构树库转化研究

统计词义消歧的研究进展

基于无指导机器学习的全文词义自动标注方法

复述技术研究综述

基于词汇支配度的汉语依存分析模型

Building a Dependency Treebank for Improving Chinese Parser

2005 年 863 信息检索评测哈尔滨工业大学信息检索研究室技术报告

基于语言模型验证的词义消歧语料获取

句法与词义相结合的中文代词消解

中文事件抽取技术研究

句法与词义结合的中文代词消解

基于层次聚类的自适应信息过滤学习算法

基于网络挖掘的实体关系元组自动获取

SUBDIVIDING VERBS TO IMPROVE SYNTACTIC PARSING

基于双语语料库的短语复述实例获取研究

话题检测与跟踪的评测及研究综述

一种基于主题的文本聚类方法

基于最大熵分类器的语义角色标注

基于信息增益改进贝叶斯模型的汉语词义消歧

基于网络挖掘的上下文相关词汇级复述研究

基于SVM的汉语句子片段划分

2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告

集成多种背景语义知识的共指消解

BOOTSTRAPPING FOR EXTRACTING RELATIONS FROM LARGE CORPORA

复述技术研究综述

基于词汇支配度的汉语依存分析模型

基于人工标注的个性化检索系统评测的研究

面向协作式问答的问题理解技术研究

Intra-document Coreference Resolution: The state of the art

基于子话题分治匹配的新事件检测

基于语义域语言模型的中文话题关联检测

信息过滤中基于二元近似关系分布的噪声屏蔽算法

句法与词义相结合的中文代词消解

中文人称名词短语单复数自动识别

基于层次聚类的自适应信息过滤学习算法

基于网络挖掘的实体关系元组自动获取

SUBDIVIDING VERBS TO IMPROVE SYNTACTIC PARSING

基于双语语料库的短语复述实例获取研究

话题检测与跟踪的评测及研究综述

一种基于主题的文本聚类方法

基于最大熵分类器的语义角色标注

基于网络挖掘的上下文相关词汇级复述研究

2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告

基于线索词识别和训练集扩展的中文问题分类

基于ontology抽取优化初始选择的检索结果聚类

集成多种背景语义知识的共指消解

BOOTSTRAPPING FOR EXTRACTING RELATIONS FROM LARGE CORPORA

短语结构树库向依存结构树库转化研究

基于话题和修辞识别的阅读理解why型问题回答

基于柱搜索的高阶依存句法分析

基于检索历史上下文的个性化查询重构技术研究

中文交互式问答用户问题相关检测研究

评价对象抽取及其倾向性分析

基于自动构建语料库的词汇级复述研究

复述技术研究

基于语言模型验证的词义消歧语料获取

短语结构树库向依存依存结构树库转化研究

基于启发式错误驱动学习的中文时间表达式识别

基于潜在语义索引和自组织映射网的检查结果聚类方法

基于SVMTool的中文词性标注

基于宏微观重要性判别模型的时序多文档文摘

基于社会网络的人名检索结果重名消解

中文事件抽取技术研究

一种基于主题的文本聚类方法

基于最大熵分类器的语义角色标注

基于SVM的汉语句子片段划分

基于二元分类的复述搭配抽取

基于改进TextTiling方法的用户新兴趣发现的研究

开放域问答技术研究进展

基于潜在语义索引和自组织映射网的检索结果聚类方法

基于浅层语义树核的阅读理解答案句抽取

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136