东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于迁移的微博分词和文本规范化联合模型

ISSN号：1000-565X
期刊名称：《华南理工大学学报：自然科学版》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]武汉大学计算机学院,湖北武汉430072, [2]湖北科技学院计算机科学与技术学院,湖北咸宁437100
相关基金：国家自然科学基金重点资助项目（61133012）;国家自然科学基金资助项目（61173062,61373108）;国家社会科学基金重点资助项目（11＆ZDl89）

中文摘要：

传统的分词器在微博文本上不能达到好的性能，主要归结于：（1）缺少标注语料；（2）存在大量的非规范化词．针对这两类问题，文中提出一个分词和文本规范化的联合模型，该模型在迁移分词基础上，通过扩充迁移行为来实现文本规范化，进而对规范的文本进行分词．在实验中，采用大量的规范标注文本及少量的微博标注文本进行训练，实验结果显示，该模型具有较好的域适应性，其分词错误率比传统的方法减少了10．35％．

同期刊论文项目

汉语文本推理的资源建设和统计分析研究

期刊论文 36 会议论文 33

汉语语篇连贯的事件链模型研究

期刊论文 15

篇章级中文语义分析理论与方法

期刊论文 50

同项目期刊论文

基于PU学习算法的虚假评论识别研究

基于卷积网络的句子语义相似性模型

一种分布式防火墙规则有效性检测算法

融入事件知识的主题表示方法

面向汽车领域的软文识别研究

中文篇章级句间关系自动分析

基于CRF和半监督学习的中文时间信息抽取

基于分析和生成的复述与SMT语料扩展

基于复杂网络重叠社团发现的微博话题检测

文本蕴涵研究现状和发展趋势

基于多标签CRF的疾病名称抽取

基于位置敏感Embedding的中文命名实体识别

基于事件卷积特征的新闻文本分类

基于无监督学习算法的推特文本规范化

基于神经网络模型的产品属性情感分析

中文微博情感倾向性分析特征工程

省略识别及恢复联合模型研究

基于OC-SVM的新情感词识别

中文复杂名词短语依存句法分析

基于SVM和CRF多特征组合的微博情感分析

一种面向社区型问句检索的主题翻译模型

文本可视化研究综述

社会媒体中用户的隐式消费意图识别

因果关系及其在社会媒体上的应用研究综述

一个基于超图的词义归纳模型

基于核特征的商品图像句子标注

基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例

使用过训练提升词性标注依存句法联合模型的速度

A Multiple Feature Approach for Disorder Normalization in Clinical Notes

面向网络文本的信息可信度评估方法研究

社会焦点透视镜系统——大数据视角下的舆情观测平台

基于网络结构的多种用户影响力分析算法对比研究

面向社会媒体的消费意图识别：任务、挑战与机遇

跨社区的用户链指技术综述

Generating Chinese named entity data from parallel corpora

基于自学习的汉语开放域命名实体边界识别

实体链指技术研究进展

基于边权重的主题核心术语抽取

中文篇章级句间语义关系识别

中文篇章级句间语义关系体系及标注

基于Folksonomy的本体构建综述

基于词语关联度的查询缩略

BUEES： a bottom-up event extraction system

借重于人工知识库的词和义项的向量表示：以HowNet为例

基于核特征和tag-rank的商品图像句子标注

统计与词典相结合的领域自适应中文分词

基于主动学习的中文依存句法分析

基于关键词精化和句法树的商品图像句子标注

面向产品评论分析的短文本情感主题模型

基于协同训练的文本蕴含识别

基于知识话题模型的文本蕴涵识别

基于PU学习算法的虚假评论识别研究

基于卷积网络的句子语义相似性模型

融入事件知识的主题表示方法

基于复杂网络重叠社团发现的微博话题检测

基于位置敏感Embedding的中文命名实体识别

一个基于超图的词义归纳模型

基于事件指导的多文档生成式摘要方法

基于结构化事件的主题表示

基于矩阵分解和子模最大化的微博新闻摘要方法

融入显著性事件信息的标题生成方法

A Multiple Feature Approach for Disorder Normalization in Clinical Notes

面向产品评论分析的短文本情感主题模型

Multi-Document Extractive Summarization Using Event Semantic Relation Graph Clustering.

Event Graph Based Contradiction Recognition from Big Data Collection

基于短文本隐含语义特征的文本蕴涵识别

Finding deceptive opinion spam by correcting the mislabeled instances

基于协同训练的文本蕴含识别

基于半监督学习算法的虚假评论识别研究

Automatic Ontology Construction Based on Clustering Nucleus

基于信息单元融合的新闻原子事件抽取

基于知识话题模型的文本蕴涵识别

基于PU学习算法的虚假评论识别研究

基于图式的文本蕴涵识别初探

BioTSA: Annotating Token Semantic Association to Support Biomedical Text Mining

基于语义规则的中文矛盾关系识别方法

基于支持向量机的中文文本蕴涵识别研究

基于事件语义特征的中文文本蕴含识别

基于卷积网络的句子语义相似性模型

基于CRF和半监督学习的中文时间信息抽取

文本蕴涵研究现状和发展趋势

基于多标签CRF的疾病名称抽取

基于无监督学习算法的推特文本规范化

基于SVM和CRF多特征组合的微博情感分析

一种联合抽取疾病、药物以及副作用事件的方法

基于事件链的汉语语篇连贯资源建设

面向产品评论分析的短文本情感主题模型

期刊信息

《华南理工大学学报：自然科学版》
北大核心期刊（2011版）

主管单位:国家教育部科技司
主办单位:华南理工大学
主编：李元元
地址：广州市天河区五山路华南理工大学17号楼
邮编：510640
邮箱：journal@scut.edu.cn
电话：

国际标准刊号：ISSN：1000-565X
国内统一刊号：ISSN：44-1251/T
邮发代号:46-174

获奖情况:
本学报荣获1996年国家教委系统优秀科技期刊二等奖...,1999年荣获全国优秀高校自然科学学报及教育部优秀...,2001年荣获广东省优秀期刊奖和广东省优秀科技期刊...,2004年获全国高校优秀科技期刊二等奖,2006年获首届教育部优秀科技期刊奖,2008年荣获第二届教育部优秀科技期刊奖

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:22954