位置:成果数据库 > 期刊 > 期刊详情页
基于多维扩展特征与深度学习的微博短文本情感分析
  • ISSN号:1009-5896
  • 期刊名称:《电子与信息学报》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术] TP391.43[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]情感计算与先进智能机器安徽省重点实验室,合肥230009, [2]德岛大学工学部,德岛770-8509
  • 相关基金:国家自然科学基金(61432004),模式识别国家重点实验室开放课题(NLPR)(201407345),安徽省自然科学基金(1508085QF119),中国博士后科学基金(2015M580532)
中文摘要:

该文提出了一种基于深度信念网络(DBN)和多维扩展特征的模型,实现对中文微博短文本的情感分类。为降低传统文本分类方法在处理微博短文时特征稀疏的影响,引入社交关系网络作为扩展特征,依据评论者和博主之间的社交关系,提取相关评论扩展原始微博,将扩展后的多维特征作为深度信念网络的输入。通过叠加多层玻尔兹曼机(RBM)构建DBN模型底层网络结构,多层玻尔兹曼机可以对原始输入抽象并获得数据的深层语义特征。在多个RBM层上叠加一层分类玻尔兹曼机(Class RBM),实现最终情感分类。实验结果表明,通过调整模型参数和网络结构,构建的深度学习模型在情感分类中能够获得比SVM和NB等浅层分类系统更优的结果,另外,实验证明使用扩展多维特征方法可提高短文本情感分类的性能。

英文摘要:

This paper presents a Deep Belief Nets (DBN) model and a multi-modality feature extraction method to extend features' dimensionalities of short text for Chinese microblogging sentiment classification. Besides traditional features sets for document classification, comments for certain posts are also extracted as part of the microblogging features according to the relationship between commenters and posters through constructing microblogging social network as input information. Multi-modality features are combined and adopted as the input vector for DBN. A DBN model, which is stacked with several layers of Restricted Boltzmann Machine (RBM), is implemented to initialize the structure of neural network. The RBM layers can take probability distribution samples of input data to learn hidden syntactic structures for better feature representation. A Classification RBM (ClassRBM) layer, which is stacked on top of the former RBM layers, is adapted to achieve the final sentiment classification. The results demonstrate that, with proper structure and parameter, the performance of the proposed deep learning method on sentiment classification is SVM or NB, which proves that DBN is suitable for dimensionality extension method. better than the state of the art surface learning models such as short-length document classification with the proposed feature

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电子与信息学报》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院电子学研究所 国家自然科学基金委员会信息科学部
  • 主编:朱敏慧
  • 地址:北京市北四环西路19号
  • 邮编:100190
  • 邮箱:jeit@mail.ie.ac.cn
  • 电话:010-58887066
  • 国际标准刊号:ISSN:1009-5896
  • 国内统一刊号:ISSN:11-4494/TN
  • 邮发代号:2-179
  • 获奖情况:
  • 国内外数据库收录:
  • 荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:24739