位置:成果数据库 > 期刊 > 期刊详情页
基于动词依存集的领域概念聚类方法
  • ISSN号:1006-7043
  • 期刊名称:《哈尔滨工程大学学报》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]天津理工大学计算机视觉与系统省部共建教育部重点实验室,天津300384, [2]天津理工大学天津市智能计算及软件新技术重点实验室,天津300384
  • 相关基金:国家自然科学基金资助项目(61202169,61301140); 天津市“131”创新型人才培养工程
中文摘要:

为了能在小规模特定领域语料库上进行有效的概念聚类,提出了一种基于动词依存集的领域概念聚类方法。根据同类领域概念与特定的领域动词共现这一特征,在领域专家的辅助下制定动词依存集,通过计算在主谓结构和动宾结构中与动词依存集共现的概念动词依存度,将依存度高于阈值的概念聚为一类。实验证明,该方法在小规模特定领域语料库上较为实用,聚类结果的概念重合率优于基于LSI和基于搜索引擎的概念聚类方法。

英文摘要:

In order to process the small-scale domain corpus,a domain concept clustering method based on the verb dependency set was proposed. According to the feature that the same cluster of domain concept appears together with specific domain verbs,the verb dependency set was developed with the assistance of domain experts. Next,the verb dependency value of concept which appeared together with verb dependency set in subject-predicate and verbobject structure was calculated,then the concepts that had higher dependency value than threshold were clustered.Experimental results showed that this method gets higher concept coincide than the LSI-based and the search engine-based concept clustering method,and it just adapts to processing the small-scale domain corpus.

同期刊论文项目
期刊论文 8 会议论文 5
同项目期刊论文
期刊信息
  • 《哈尔滨工程大学学报》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国工业和信息化部
  • 主办单位:哈尔滨工程大学
  • 主编:杨士莪
  • 地址:哈尔滨市南岗区南通大街145号1号楼
  • 邮编:150001
  • 邮箱:xuebao@hrbeu.edu.cn
  • 电话:0451-82519357
  • 国际标准刊号:ISSN:1006-7043
  • 国内统一刊号:ISSN:23-1390/U
  • 邮发代号:14-111
  • 获奖情况:
  • 工信部科技期刊评比"优秀期刊奖",中国高校科技期刊评比"精品期刊奖","北方十佳期刊奖",首届黑龙江省政府出版奖--优秀期刊奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:11823