位置:成果数据库 > 期刊 > 期刊详情页
基于张量的XML相似度计算方法
  • ISSN号:1001-0920
  • 期刊名称:《控制与决策》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:大连理工大学软件学院,辽宁大连116620
  • 相关基金:国家自然科学基金项目(61370144)
中文摘要:

扩展标记语言(XML)带有一定的结构和语义信息,与普通文本相比,XML具有描述精确、表现形式丰富等特点,但同时也使得传统的自然语言处理和数据挖掘等技术不能直接应用.根据XML内容和结构并非独立,内容影响结构,结构作用于内容,提出一种基于张量的XML特征降维及综合相似度计算方法.针对XML文档,使用张量表示并采用基于最大互信息的方法对其进行降维,采用将XML结构和内容相融合的综合相似度度量方法确定结构和内容的内在联系及共同作用方式,提高XML综合相似度计算性能.实验及结果分析验证了所提出方法的有效性.

英文摘要:

XML documents have both structural and semantic information, bringing data integration and deeply utilization based on XML more precise description and versatile expression, but meanwhile traditional natural language processing(NLP) and data mining(DM) methods can not be applied directly. Feature dimension reduction and general similarity of XML based on tensor analysis are discussed. Considering the correlation between XML's structure and content,a tensor based method of describing XML documents and a maximization mutual information(MMI) method of XML's dimension reduction are presented. Since the structure and the content are not independent each other, a tensor based algorithm of calculating general similarity from a non-linear angle is designed to show their relationships and effects, which can improve the calculated performance for the general similarity of XML. The experimental results show the effectiveness of the proposed method.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《控制与决策》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国教育部
  • 主办单位:东北大学
  • 主编:张嗣瀛 王福利
  • 地址:沈阳市东北大学125信箱
  • 邮编:110004
  • 邮箱:kzyjc@mail.neu.edu.cn
  • 电话:024-83687766
  • 国际标准刊号:ISSN:1001-0920
  • 国内统一刊号:ISSN:21-1124/TP
  • 邮发代号:8-51
  • 获奖情况:
  • 1997年被评为辽宁省优秀编辑部,1999年期刊影响因子在信息与系统类期刊中排名第二位
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:32961