位置:成果数据库 > 期刊 > 期刊详情页
基于元数据驱动的ETL架构设计
  • ISSN号:1000-386X
  • 期刊名称:《计算机应用与软件》
  • 时间:0
  • 分类:TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术] TN912.3[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]燕山大学信息科学与工程学院,河北秦皇岛066004
  • 相关基金:国家自然科学基金(60773100);教育部科学技术研究重点项目(205014);河北省教育厅科研计划项(2006143):
中文摘要:

ETL(Extract-Transform-Load)是数据仓库获得高质量数据的重要环节,一个设计良好、功能强大的ETL工具对于构建一个数据质量、结构良好的数据仓库有着重要意义。首先分析了传统ETL架构的局限性以及元数据管理对ETL过程的重要性,然后对传统的ETL架构进行改进,结合元数据管理思想,提出并设计了一种新的基于元数据驱动的ETL架构。结果表明,该ETL架构通过增加数据中转区并使整个ETL过程在元数据的指导下进行,有效保证了数据仓库的数据质量,提高了数据装载的效率,减轻了数据源和目标数据库的压力,增加了数据转换的灵活性和可靠性。

英文摘要:

ETL (Extract-Transform-Load) is an important part for Data Warehouse to gain data with high quality. A kind of ETL tool which is well designed and powerful in function plays the key role in building a Data Warehouse System with good data quality and structure. First,in the paper it points out the limitations of traditional architecture of ETL and analyses the importance of the metadata Management to ETL process. Then,it improves the traditional ETL architecture and combines with the theory of Metadata Management to present a new ETL architecture based on metadata-driven. Theoretical analysis and results show that data quality in Data Warehouse is ensured efficiently and the data loading efficiency is raised by that ETL architecture due to adding a DSA in it as well as Metadata supervising the whole ETL process ,the ETL process underlying the proposed architecture can alleviate the pressure from data source and target database greatly and improve the flexibility and reliability of Data Transformation.

同期刊论文项目
期刊论文 91 会议论文 9 专利 1
同项目期刊论文
期刊信息
  • 《计算机应用与软件》
  • 北大核心期刊(2011版)
  • 主管单位:上海科学院
  • 主办单位:上海市计算技术研究所 上海计算机软件技术开发中心
  • 主编:朱三元
  • 地址:上海市愚园路546号
  • 邮编:200040
  • 邮箱:cas@sict.stc.sh.cn
  • 电话:021-62254715 62520070-505
  • 国际标准刊号:ISSN:1000-386X
  • 国内统一刊号:ISSN:31-1260/TP
  • 邮发代号:4-379
  • 获奖情况:
  • 全国计算机类中文核心期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2011版),中国北大核心期刊(2000版)
  • 被引量:27463