位置:成果数据库 > 期刊 > 期刊详情页
Google三大云计算技术对海量数据分析流程的技术改进优化研究
  • ISSN号:0252-3116
  • 期刊名称:《图书情报工作》
  • 时间:0
  • 分类:G202[文化科学—传播学]
  • 作者机构:[1]中国人民大学信息资源管理学院,北京100872
  • 相关基金:国家社会科学基金重大项目“云计算环境下的信息资源集成与服务研究”(项目编号:12&ZD220)和国家自然科学基金项目“语义Web环境下的大规模协同知识处理模型研究”(项目编号:71103020)研究成果之一.
中文摘要:

[目的/意义]建构云计算技术环境下的海量数据分析是一种需要预载大量数据集的数据计算处理。针对传统海量数据分析处理数据细节方式所导致的分析质量与效率问题,运用Google三大云计算技术对其进行改进。[方法 /过程]通过对Google三大云计算技术——GFS、MapReduce和Bigtable进行文献调查、内容分析和技术分析,梳理出Google云计算技术在数据处理、技术架构和算法模型等方面的部署创新和设计改进。[结果/结论]将Google云计算技术与传统本地数据分析处理方式与细节进行比较分析,得出Google云计算技术在操作海量数据分析时所具备的处理优势。借助Google云计算三大技术,提出海量数据分析流程在存储和访问、组织与管理以及并行处理3个方面的技术优化与改进策略。

英文摘要:

[Purpose/significance ] Massive data analysis constructed in the cloud computing environment is a data calculation which needs to preload large data sets. Aiming at the analysis quality and efficiency issues caused by the detail way of massive data analysis and processing by the traditional methods, this paper uses the three Google cloud computing techniques to improve it. [ Method/process] Applying literature research, content analysis and technical analysis to the three Google cloud computing technology: GFS, MapReduce and Bigtable, this paper summarizes the deployment innova- tion and design improvement of Google cloud computing technology in data processing, technology framework and algorithm model. [ Result/conclusion ] Comparing Google cloud computing technology comparative analysis with traditional local data processing mode, this paper concludes the processing advantages of Google cloud computing technology in operating mas- sive data analysis. According to the Google cloud computing, we propose technology optimization and improvement of massive data analysis process in the three aspects- store and access, organization and management, as well as parallel processing.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《图书情报工作》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院文献情报中心
  • 主编:初景利
  • 地址:北京中关村北四环西路33号
  • 邮编:100190
  • 邮箱:journal@mail.las.ac.cn
  • 电话:010-82623933 82626611-6614
  • 国际标准刊号:ISSN:0252-3116
  • 国内统一刊号:ISSN:11-1541/G2
  • 邮发代号:2-412
  • 获奖情况:
  • 多次荣获"全国图书馆学优秀期刊"、"全国优秀科技...,2005年,更荣获中国国家期刊奖二等奖,是本届唯一...
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:57601