观点信息抽取和倾向性分析是信息抽取领域的重要研究课题之一,本课题研究汉语观点信息抽取和倾向性分析技术,主要研究内容包括基于多重冗余标记CRFs的句子级观点倾向性判别技术、融于主题信息和词典信息的篇章级观点信息倾向性判别技术、观点倾向性判别中的领域自适应技术、多类别实体识别技术、基于知识关联的实体排歧与属性抽取技术、基于网络挖掘的实体音译技术、网络挖掘辅助的机构名翻译抽取技术、语言学理论指导的汉语实体同指消解、观点持有者抽取技术以及基于分析动作建模的汉语依存句法分析等。主要研究成果包括31篇学术论文,其中包括SCI索引的国际期刊论文2篇,国际顶级会议论文9篇,申请国家发明专利2项、申请国家软件著作权登记两项、国家标准立项一项,同时建立了大规模的语言资源,并组织了第一届中文文本倾向性分析评测,推动了该领域的研究发展。
英文主题词Natural language processing; Information extraction; Opinin detection; Sentiment analysis