位置:成果数据库 > 期刊 > 期刊详情页
基于序列模式的汉语比较句识别方法
  • ISSN号:0253-2395
  • 期刊名称:山西大学学报(自然科学版)
  • 时间:2013.5.15
  • 页码:172-179
  • 分类:TP312[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]山西大学计算机与信息技术学院,山西太原030006, [2]山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006, [3]山西大学数学科学学院,山西太原030006
  • 相关基金:国家自然科学基金(61175067;60970014;61272095);山西省自然科学基金(2010011021-1);山西省科技攻关项目(20110321027-02)
  • 相关项目:基于文本观点挖掘的多对象评级理论与方法研究
中文摘要:

比较句中蕴含着大量的比较观点信息.文章根据汉语比较句特点,利用序列模式挖掘算法获取比较模式.为了提高挖掘算法的性能,对MS-PS算法进行改进,将比较句识别贡献较大的一些项名词和比较特征词设置较低的最小支持度,其余项的最小支持度取项支持度的倍数和1/N(N为序列集大小)中较大值.最后,将获取的序列模式直接匹配待识别的甸子.在两种数据集上进行实验,结果表明本文所给出的SeqPattMine算法是可行的.

英文摘要:

A comparative sentence implies a great deal of comparison opinions. It is a special kind of sentence pattern in modern Chinese. Sequential pattern mining algorithm is used for acquiring comparison pattern. In order to enhance the performance of algorithm, the sequential pattern mining is improved. Some small val- ues are set for minimum supports of items (noun) and comparison feature words and part of speech and the minimum support of the other items chooses a larger value between a multiple of item support multiplied and 1/N (N is the size of the sequence set). Moreover, the comparative sentences are identified by obtaining pattern based on sequential pattern mining algorithm in directly match way. The experiment result indicates that the proposed SeqPattMine algorithm is feasible.

同期刊论文项目
期刊论文 62 会议论文 2 获奖 2 专利 1
同项目期刊论文
期刊信息
  • 《山西大学学报:自然科学版》
  • 北大核心期刊(2011版)
  • 主管单位:山西省教育厅
  • 主办单位:山西大学
  • 主编:杨斌盛
  • 地址:太原市坞城路92号
  • 邮编:030006
  • 邮箱:xbbjb@sxu.edu.cn
  • 电话:0351-7010455
  • 国际标准刊号:ISSN:0253-2395
  • 国内统一刊号:ISSN:14-1105/N
  • 邮发代号:22-42
  • 获奖情况:
  • 边疆七年获山西省一级期刊荣誉(1993-1999)
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),英国动物学记录,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:5651