随着基于XML的数据集成系统规模的不断扩大,其构建和维护的复杂性越来越高。系统工程化建设迫切需要提出一套新的数据集成理论方法来加以支持。本课题深入分析数据集成系统建设复杂性的根源,计划提出基于XML的数据集成组件模型,在此基础上研究组件内部支持混合数据源的高效XML数据转换算法、组件之间基于XML查询重写的组合算法和组件之上的查询优化方法等,从而支持采用分而治之的策略构建和维护系统;同时,本课题将研究组件内部和组件之间的XML模式映射自动生成的方法,包括面向统一特征模型的模式映射特征抽取算法、基于XML模式树的模式映射方案产生算法和基于XML语义约束的模式映射方案筛选算法等,从而辅助用户建立模式映射,有效减少数据环境变化时数据集成系统的调整代价,提高系统的自适应性。本课题最终提出基于XML的自适应的组件式数据集成系统的理论和方法,来支持数据集成系统高效的工程化建设。