位置:成果数据库 > 期刊 > 期刊详情页
基于特征码的大规模XML文档去重研究
  • ISSN号:1673-0194
  • 期刊名称:《中国管理信息化:综合版》
  • 时间:0
  • 分类:TP393[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]吉林大学,网络中心,长春,130021 东北师范大学,计算机学院,长春,130024 东北师范大学,计算机学院,长春,130024 东北师范大学,计算机学院,长春,130024
  • 相关基金:国家自然科学基金项目(60473042)
中文摘要:

本文总结了目前基于XML文档的一些信息检索技术,并通过一种特征码技术,将海量的XML文档中内容重复的文档检索出来.利用可以将XML文档映射到关系数据库中的X-RESTORE技术管理、存储、查找XML文档,并利用它的解析器快速定位特征码.将特征码通过高效的B+树来索引,大大提高系统的处理效率.

同期刊论文项目
期刊论文 63 会议论文 19
同项目期刊论文
期刊信息
  • 《中国管理信息化:综合版》
  • 主管单位:吉林省新闻出版局
  • 主办单位:吉林科学技术出版社
  • 主编:吴文凯
  • 地址:长春市人民大街4646号出版大厦8层
  • 邮编:130021
  • 邮箱:
  • 电话:0431-85635173 5642030-3167
  • 国际标准刊号:ISSN:1673-0194
  • 国内统一刊号:ISSN:22-1359/TP
  • 邮发代号:
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:3077