东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

中文微博情感倾向性分析特征工程

ISSN号：0253-2395
期刊名称：《山西大学学报：自然科学版》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]哈尔滨工业大学计算机科学与技术学院信息检索研究中心,黑龙江哈尔滨150001, [2]哈尔滨工业大学机电学院媒体系,黑龙江哈尔滨150001
相关基金：国家自然科学基金重点项目（61133012）;国家自然科学青年基金项目（61300113）;国家自然科学基金面上项目（61273321）

作者：李泽魁, 赵妍妍[2], 秦兵[1], 刘挺[1]

关键词：情感倾向性分析, 中文微博, 特征工程, sentiment classification, Chinese microblog, feature engineering

中文摘要：

情感倾向性分析是情感分析的重要组成部分,是一种按照情感倾向对文本进行分类的任务。微博与传统的评论文本相比更加口语化与符号化,因此对微博进行情感倾向性分析是一个非常有挑战性的任务。基于机器学习的方法是情感倾向性分析最经典的算法,核心是要进行特征的分析和选择,例如词袋特征等。然而,由于中文语言的独特性,前人很多有效的特征都是语言相关的,将其直接用于中文微博效果不佳。在中文微博语料上,还没有学者进行细致的特征工程建设。基于此,文章综合国内外诸多特征,并考虑到中文的独特性,对中文微博的褒贬中倾向性判别特征工程的词、词组、数值和句法特征分别进行了研究,并提出了基于词典规则的情感评分的新特征。最后经过大量实验与分析,得出了可靠的特征组合。实验结果表明,此方法能够明显提高情感倾向性分析的结果。

英文摘要：

Sentiment classification,a basic sentiment analysis task,aims to classify a sentiment sentence into positive,negative and neutral.Sentiment analysis on microblog is challenging,which is different from it on common product reviews,due to the characteristics of microblog.Many previous works used machine learning based approaches to solve this task,the core of which is to try and select useful features,for instance,＂bag of words＂.However,these proposed features may not be suitable for Chinese due to linguistic differences.What is more,there is no feature engineering for Chinese microblog in details.In this paper,we do some feature engineering for Chinese microblog sentiment classification,from words,phrases,numbers,syntactic features,and new feature named dictionary-rule based sentiment score,in order to make a better performance beyond the baseline.At last,we obtain reliable feature set through a large number of experiments and analysis.Our approach significantly improves the results of sentiment classification.

同期刊论文项目

面向产品评论的评价对象层次结构分析与极性识别

期刊论文 2

篇章级中文语义分析理论与方法

期刊论文 50

开放域动态事实性信息获取及融合方法研究

期刊论文 12

同项目期刊论文

基于PU学习算法的虚假评论识别研究

基于迁移的微博分词和文本规范化联合模型

基于卷积网络的句子语义相似性模型

一种分布式防火墙规则有效性检测算法

融入事件知识的主题表示方法

面向汽车领域的软文识别研究

中文篇章级句间关系自动分析

基于CRF和半监督学习的中文时间信息抽取

基于分析和生成的复述与SMT语料扩展

基于复杂网络重叠社团发现的微博话题检测

文本蕴涵研究现状和发展趋势

基于多标签CRF的疾病名称抽取

基于位置敏感Embedding的中文命名实体识别

基于事件卷积特征的新闻文本分类

基于无监督学习算法的推特文本规范化

基于神经网络模型的产品属性情感分析

省略识别及恢复联合模型研究

基于OC-SVM的新情感词识别

中文复杂名词短语依存句法分析

基于SVM和CRF多特征组合的微博情感分析

一种面向社区型问句检索的主题翻译模型

文本可视化研究综述

社会媒体中用户的隐式消费意图识别

因果关系及其在社会媒体上的应用研究综述

一个基于超图的词义归纳模型

基于核特征的商品图像句子标注

基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例

使用过训练提升词性标注依存句法联合模型的速度

A Multiple Feature Approach for Disorder Normalization in Clinical Notes

面向网络文本的信息可信度评估方法研究

社会焦点透视镜系统——大数据视角下的舆情观测平台

基于网络结构的多种用户影响力分析算法对比研究

面向社会媒体的消费意图识别：任务、挑战与机遇

跨社区的用户链指技术综述

Generating Chinese named entity data from parallel corpora

基于自学习的汉语开放域命名实体边界识别

实体链指技术研究进展

基于边权重的主题核心术语抽取

中文篇章级句间语义关系识别

中文篇章级句间语义关系体系及标注

基于Folksonomy的本体构建综述

基于词语关联度的查询缩略

BUEES： a bottom-up event extraction system

借重于人工知识库的词和义项的向量表示：以HowNet为例

基于核特征和tag-rank的商品图像句子标注

统计与词典相结合的领域自适应中文分词

基于主动学习的中文依存句法分析

基于关键词精化和句法树的商品图像句子标注

面向产品评论分析的短文本情感主题模型

社会焦点透视镜系统——大数据视角下的舆情观测平台

中文篇章级句间关系自动分析

社会焦点透视镜系统——大数据视角下的舆情观测平台

Generating Chinese named entity data from parallel corpora

基于自学习的汉语开放域命名实体边界识别

Negation scope detection with a conditional random field model

实体链指技术研究进展

基于边权重的主题核心术语抽取

中文篇章级句间语义关系识别

中文篇章级句间语义关系体系及标注

基于Folksonomy的本体构建综述

基于词语关联度的查询缩略

期刊信息

《山西大学学报：自然科学版》
北大核心期刊（2011版）

主管单位:山西省教育厅
主办单位:山西大学
主编：杨斌盛
地址：太原市坞城路92号
邮编：030006
邮箱：xbbjb@sxu.edu.cn
电话：0351-7010455

国际标准刊号：ISSN：0253-2395
国内统一刊号：ISSN：14-1105/N
邮发代号:22-42

获奖情况:
边疆七年获山西省一级期刊荣誉（1993-1999）

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,英国动物学记录,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:5651