情感倾向是文本的一种主观性特征,用来表示作者对篇章主题或者文中对象所持的态度或观点是肯定还是否定。情感倾向研究不仅具有很高的学术意义,且极具实用价值,不仅可作为态度分类、评论检索的核心技术,也可应用于商业智能或辅助决策等。本项课题针对中文文本情感倾向的分析技术,在以下几个层次开展研究1)建立了词汇、句子和篇章等各种粒度的情感倾向模型,提出了多个情感倾向分析挖掘算法;2)通过人工标注和机器学习相结合的方式,建立了中文情感倾向分析标准语料库和特定领域本体库;3)和计算所、自动化所,上海交大合作,组织了中文倾向性分析(COAE)系列评测,促进了中文倾向性分析技术的发展。除了研究评测技术之外,我们也参加了TREC的观点检索和COAE评测,取得了很好的成绩;4)研究和情感倾向分析相关联的机器学习和信息检索核心技术,以促进情感倾向分析算法性能的提高。经过三年的研究,在ICML, ACL, EMNLP, SIGIR, CIKM, ISWC等国际权威会议和期刊上发表了21篇学术论文,申请专利2 项(其中1项已经获批),从而圆满地完成了任务书所规定的目标。
英文主题词Sentiment; Semantic Orientation; Opinion Retrieval; Sentiment Classification; Text Mining