位置:成果数据库 > 期刊 > 期刊详情页
维吾尔语意见挖掘关系抽取研究
  • ISSN号:1000-7024
  • 期刊名称:计算机工程与设计
  • 时间:2013.9.16
  • 页码:3260-3265
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046, [2]新疆大学网络中心,新疆乌鲁木齐830046, [3]新疆大学软件学院,新疆乌鲁木齐830008
  • 相关基金:国家自然科学基金项目(61262064、60963017、61063026、61063043);国家社科基金项目(10BTQ045、11XTQ007)
  • 相关项目:维吾尔文WEB舆情挖掘的关键理论及技术研究
中文摘要:

在分析维吾尔语词性规则和语法特征的基础上,以维吾尔语评论性语句为研究语料,提出了一种基于Bootstrap—ping算法的意见挖掘关系抽取方法。在每一次迭代过程中,根据改进的评分公式选取最优模式抽取主题词一意见词对;迭代结束后,对于主题一意见词对为空的评论语句,使用最近匹配算法抽取主题一意见词对;用并联模式和否定模式对抽取的主题一意见词对进行扩展和修正。关系抽取的最终目标是为每一个评论性语句建立一个或多个二元组〈主题词,意见词〉,并使主题词和意见词一一对应。实验结果表明了该方法在关系抽取上的有效性。

英文摘要:

On the basis of analyzing the Uyghur part-of-speech rules and grammatical characteristics, a relation extraction met- hod of opinion mining based on Bootstrapping algorithm is proposed, which take Uyghur comment sentences as the research cor- pus. In each iteration process, the optimal patterns are selected to extract topic-opinion pairs according to the improved score for- mulas. After the iteration, for the comment sentences that topic-opinion pairs are empty, the nearest matching algorithm is used to extract topic-opinion pairs. Finally, paralleling model and negation model are introduced to expand and amend topic-opinion pairs. The ultimate goal of relation extraction is to establish one or more tuples ~topic, opinion~ for every comment sentence, and make the topic word correspond to the opinion word. Experimental results show the effectiveness of the proposed method in relation extraction.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机工程与设计》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团
  • 主办单位:中国航天科工集团二院706所
  • 主编:汤铭瑞
  • 地址:北京142信箱37分箱
  • 邮编:100854
  • 邮箱:ced@china-ced.com
  • 电话:010-68389884
  • 国际标准刊号:ISSN:1000-7024
  • 国内统一刊号:ISSN:11-1775/TP
  • 邮发代号:82-425
  • 获奖情况:
  • 中国科学引文数据库来源期刊,中国学术期刊综合评价数据库来源期刊,中国科技论文统计与分析用期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:45616