东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

使用过训练提升词性标注依存句法联合模型的速度

ISSN号：1003-0077
期刊名称：《中文信息学报》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
相关基金：国家重点基础研究发展计划（973）（2014CB340503）; 国家自然科学基金面上项目（61133012,61370164）

作者：张梅山[1], 车万翔[1], 刘挺[1]

关键词：词性标注, 依存句法分析, 联合模型, 过训练, POS - Tagging , Dependency Parsing , Joint Models , Uptraining

中文摘要：

词性标注和依存句法分析是自然语言处理领域中句子级别基本分析技术的两个重要任务,一般来说词性标注是依存句法分析的一个前提条件。基于联合分析的方法将这两个任务在一个统一的统计模型中联合处理能避免错误传播这类问题的发生,因此这种联合模型能取得比较好的性能。但是这种联合模型会带来算法上的时间复杂度的额外开销,因此导致联合分析的方法,速度非常慢。本文提出一种基于过训练的方法,通过极少量的性能损失,使得联合模型的解码速度提升了6倍。

英文摘要：

POS tagging and dependency parsing are basic tasks of sentence -level natural language processing. Generally POS - tagging is a necessary prerequisite for dependency parsing. The joint models which link the two tasks together and process them by a unified model have achieved improved performances, because joint modeling can avoid the error - propagation problem. However, the time complexity of joint models can be always so large, thus yields much slower speed. This paper proposes a method based on uptraining technique to improve the speed of joint models, with only very little loss in performances.

同期刊论文项目

篇章级中文语义分析理论与方法

期刊论文 50

依存句法分析子结构可信度计算研究

期刊论文 2

同项目期刊论文

基于PU学习算法的虚假评论识别研究

基于迁移的微博分词和文本规范化联合模型

基于卷积网络的句子语义相似性模型

一种分布式防火墙规则有效性检测算法

融入事件知识的主题表示方法

面向汽车领域的软文识别研究

中文篇章级句间关系自动分析

基于CRF和半监督学习的中文时间信息抽取

基于分析和生成的复述与SMT语料扩展

基于复杂网络重叠社团发现的微博话题检测

文本蕴涵研究现状和发展趋势

基于多标签CRF的疾病名称抽取

基于位置敏感Embedding的中文命名实体识别

基于事件卷积特征的新闻文本分类

基于无监督学习算法的推特文本规范化

基于神经网络模型的产品属性情感分析

中文微博情感倾向性分析特征工程

省略识别及恢复联合模型研究

基于OC-SVM的新情感词识别

中文复杂名词短语依存句法分析

基于SVM和CRF多特征组合的微博情感分析

一种面向社区型问句检索的主题翻译模型

文本可视化研究综述

社会媒体中用户的隐式消费意图识别

因果关系及其在社会媒体上的应用研究综述

一个基于超图的词义归纳模型

基于核特征的商品图像句子标注

基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例

A Multiple Feature Approach for Disorder Normalization in Clinical Notes

面向网络文本的信息可信度评估方法研究

社会焦点透视镜系统——大数据视角下的舆情观测平台

基于网络结构的多种用户影响力分析算法对比研究

面向社会媒体的消费意图识别：任务、挑战与机遇

跨社区的用户链指技术综述

Generating Chinese named entity data from parallel corpora

基于自学习的汉语开放域命名实体边界识别

实体链指技术研究进展

基于边权重的主题核心术语抽取

中文篇章级句间语义关系识别

中文篇章级句间语义关系体系及标注

基于Folksonomy的本体构建综述

基于词语关联度的查询缩略

BUEES： a bottom-up event extraction system

借重于人工知识库的词和义项的向量表示：以HowNet为例

基于核特征和tag-rank的商品图像句子标注

统计与词典相结合的领域自适应中文分词

基于主动学习的中文依存句法分析

基于关键词精化和句法树的商品图像句子标注

面向产品评论分析的短文本情感主题模型

基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例

期刊信息

《中文信息学报》
北大核心期刊（2011版）

主管单位:中国科学技术协会
主办单位:中国中文信息学会中国科学院软件研究所
主编：孙茂松
地址：北京海淀中关村南四街4号中科院软件所
邮编：100190
邮箱：jcip@iscas.ac.cn
电话：010-62562916

国际标准刊号：ISSN：1003-0077
国内统一刊号：ISSN：11-2325/N
邮发代号:

获奖情况:

国内外数据库收录:
日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:9136