位置:成果数据库 > 期刊 > 期刊详情页
基于聚类和辅助词典的模式匹配方法
  • ISSN号:1006-7043
  • 期刊名称:《哈尔滨工程大学学报》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001
  • 相关基金:国家科技支撑计划项目(2009BAH42802);国家自然科学基金项目(60873038,60903080);哈尔滨工程大学中央高校基本科研业务专项资金项目(100603).
中文摘要:

针对中文环境下的模式冲突问题,提出了一种利用元数据的模式匹配方法.该方法从数据字典中为模式提取特征向量,并采用聚类技术对其进行聚类,将语义相近的模式划分到相同聚簇中;对于同一聚簇中的不同模式,借助辅助词典计算属性间的语义相似度,并采用多种选择策略相结合的方法对结果进行过滤,为每个属性生成候选匹配集合.实验结果表明,该方法不仅可以提高模式匹配效率,而且具有较高的准确度.

英文摘要:

For the problem of schema conflict in Chinese environment, a novel metadata-based schema matching method was proposed. Firstly, a feature vector was extracted for each schema from database dictionary, and the clustering technique was performed on the vectors, then the similar schemas in semantics were divided into the same clusters. Secondly, for different schemas in the same cluster, the semantic similarities between attributes were calculated, with the help of auxiliary dictionary. Finally, a method combing a variety of strategies was used to filter the results, and the candidate matching set for each attribute was generated. The experimental results show that the proposed method can not only increase the efficiency of schema matching, but also have a higher accuracy.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《哈尔滨工程大学学报》
  • 中国科技核心期刊
  • 主管单位:中华人民共和国工业和信息化部
  • 主办单位:哈尔滨工程大学
  • 主编:杨士莪
  • 地址:哈尔滨市南岗区南通大街145号1号楼
  • 邮编:150001
  • 邮箱:xuebao@hrbeu.edu.cn
  • 电话:0451-82519357
  • 国际标准刊号:ISSN:1006-7043
  • 国内统一刊号:ISSN:23-1390/U
  • 邮发代号:14-111
  • 获奖情况:
  • 工信部科技期刊评比"优秀期刊奖",中国高校科技期刊评比"精品期刊奖","北方十佳期刊奖",首届黑龙江省政府出版奖--优秀期刊奖
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),美国数学评论(网络版),波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:11823