位置:成果数据库 > 期刊 > 期刊详情页
面向用户观点分析的多分类器集成和优化技术
  • ISSN号:0254-4164
  • 期刊名称:《计算机学报》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]华东师范大学软件学院上海市高可信计算重点实验室,上海200062
  • 相关基金:国家自然科学基金重点项目(61033007);国家“九七三”重点基础研究发展规划项目基金(2010CB328106);上海高校知识服务平台-可信物联网产学研联合研发中心(筹)(中心代号:ZF1213);创新研究群体科学基金(61021004);教育部新世纪人才支撑计划(NCET-10-0388)资助~~
中文摘要:

网络上用户生成的数据(User-Generated Data)富含用户的观点(情感),自动识别这些用户观点对很多的Web应用具有重要的作用,例如推荐系统和电子商务/政务智能系统等.但用户的观点表达通常与领域是相关的,因此对于不同的分析领域,用户难以选择到效果最好的分类器.文中针对用户观点分析问题设计了一个三阶段的多分类器集成框架,在此框架下用户只需指定可用的分类器,系统将自动选择一组最优的分类器组合,将它们的预测结果整合为最终分类结果,同时能够保证分类效果优越于最好的单分类器.针对分类器组的选择过程中面临的组合爆炸问题,文中在考虑分类器的准确度和多样性的基础上,设计了一个贪心算法选择成员分类器,并证明该算法是2-近似的.最后,在不同领域的真实数据集上进行了充分的实验,实验结果验证了文中提出的框架和算法的有效性.

英文摘要:

The user-generated data is opinion-rich,and automatic identification of user opinion plays an important role for many Web applications like recommendation systems,business and government intelligence.But the user expression on opinion is domain-dependent,and it is difficult for users to select the optimal classifier for a specific domain,especially for the users who are not familiar with the domain.A three phase opinion analysis framework based on ensemble learning is proposed in this paper,by which a set of optimal classifiers are chosen automatically to assemble for generating the final predicted results of unlabeled samples.Due to the problem of combination explosion,an approximation algorithm is proposed based on the classification accuracy and diversity to select the member classifiers,which can be proven to be 2-approximable.At last,extensive experiments are carried out to demonstrate the effectiveness of the proposed framework and algorithms for different domains on real-world datasets.

同期刊论文项目
期刊论文 102 会议论文 54 专利 12
同项目期刊论文
期刊信息
  • 《计算机学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国计算机学会 中国科学院计算技术研究所
  • 主编:孙凝晖
  • 地址:北京中关村科学院南路6号
  • 邮编:100190
  • 邮箱:cjc@ict.ac.cn
  • 电话:010-62620695
  • 国际标准刊号:ISSN:0254-4164
  • 国内统一刊号:ISSN:11-1826/TP
  • 邮发代号:2-833
  • 获奖情况:
  • 中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 美国数学评论(网络版),荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:48433