东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

云计算环境下基于协同过滤的个性化推荐机制

ISSN号：1000-1239
期刊名称：计算机研究与发展
时间：0
页码：-
分类：TP333[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
作者机构：东南大学计算机科学与工程学院,南京211189
相关基金：国家自然科学基金（No.61370207,No.61572128）; 国家电网公司总部科技项目
相关项目：云计算环境下基于维存储的OLAP聚集计算关键技术研究

作者：朱夏|宋爱波|东方|罗军舟|

关键词：海量多维数据, HADOOP, 数据索引, 聚集查询, large-scale multidimensional data, Hadoop, data index, aggregation query

中文摘要：

基于数据仓库的OLAP系统是当前海量多维数据分析的主要工具。随着信息技术的发展,海量多维数据的规模急剧增长,结构日益复杂,OLAP系统的性能严重下降,已经无法满足人们的数据分析需求。基于分布式计算系统Hadoop给出了新的海量多维数据的存储方法和查询方法。设计了HDFS上的列存储文件格式HCFile,基于HCFile给出了海量多维数据存储方案,该方案能够提高聚集计算效率,并有很好的可扩展性。同时,利用多维数据的层次性语义特征,设计了维层次索引,并给出了利用维层次索引和Map Reduce进行聚集计算的方法。通过和Hive的对比实验,表明了数据存储方案和查询方法能够有效提高海量多维数据分析的性能。

英文摘要：

The OLAP（Online Analytical Processing） system built on warehouse is the most popular tool to analyze large-scale multidimensional data. With the development of information technology, data volume grows rapidly and data structure becomes more and more complicated, so the performance of OLAP system has dropped severely, failing to meet daily data analysis needs. This paper proposes new methods to store large-scale multidimensional data and perform aggregation query with Hadoop, a parallel computing system. The paper implements a new column-store format HCFile（HDFS column file）, and proposals a new storage solution based on it. This project can improve the efficiency of aggregation,with a good scalability. Meanwhile, this paper leverages the hierarchy schema to build dimension hierarchy index, and uses Map Reduce to perform efficiency aggregation query. Through comparison experiments with Hive, it proves that the proposed storage solution and aggregation query can effectively improve the efficiency of large-scale multidimensional data analysis.

同期刊论文项目

云计算环境下面向科学工作流应用的弹性调度机制研究

期刊论文 36 会议论文 18

　信息服务的聚合与协同

期刊论文 71

云计算环境下基于维存储的OLAP聚集计算关键技术研究

期刊论文 44 会议论文 9 专利 3

基于侧信道攻击的匿名通信流量识别、分析和追踪技术研究

期刊论文 18

AMS大数据处理关键技术研究

期刊论文 21

云环境下面向大数据并行计算的工作流执行优化研究

期刊论文 11

同项目期刊论文

Tor Bridge Discovery: Extensive Analysis andLarge-scale Empirical Evaluation

TorWard: Discovery, Blocking, and Traceback ofMalicious Traffic over Tor

Optimizing data placement in heterogeneous Hadoop clusters

Towards optimized scheduling for data-intensive scientific workflow in multiple datacenter environme

Stochastic modeling of dynamic right-sizing for energy-efficiency in cloud data centers

Scientific workflow scheduling in non-dedicated heterogeneous multicluster with advance reservations

Novel Packet Size-Based Covert Channel Attacksagainst Anonymizer

A Performance Fluctuation-Aware Stochastic Scheduling Mechanism for Workflow Applications in Cloud E

Network Lifetime Maximization for Time-sensitive Data Gathering in Wireless SensorNetworks

Partition-based Online Aggregation with Shared Sampling in Cloud

副本协作预取中文件相关性查询机制研究

云计算环境下支持复杂查询的多维数据索引机制

OATS: Online Aggregation with Two-level Sharing Strategy in Cloud

洋葱路由追踪技术中时间特征的建模与分析

Partition-Based Online Aggregation with Shared Sampling in the Cloud

P2P网络中一种基于进化博弈的资源配置模型

Tor匿名通信流量在线识别方法

基于动态定价策略的数据中心能耗成本优化

面向缺失数据的数据匿名方法

副本协作预取中文件相关性查询机制

考虑失效恢复的组合服务性能建模与分析

LBSN中基于元路径的兴趣点推荐

新浪微博网信息传播分析与预测

基于社会属性的PSN消息路由算法

一种基于k-核的社会网络影响最大化算法

在线社交网络中地域性话题发现

跨数据中心的动态资源联合预留研究

无线Mesh网络中满足带宽需求的路由器部署方法

基于多维特征分析的社交网络意见领袖挖掘

LBSN中基于元路径的兴趣点推荐

新浪微博网信息传播分析与预测

基于社会属性的PSN消息路由算法

一种基于k-核的社会网络影响最大化算法

在线社交网络中地域性话题发现

跨数据中心的动态资源联合预留研究

一种带自适应飞行时间因子的粒子群算法

Efficient Location-Aware Data Placement for Data-Intensive Applications in Geo-distributed Scientific Data Centers

基于多维特征分析的社交网络意见领袖挖掘

数据中心多目标虚拟机管理研究

洋葱路由追踪技术中时间特征的建模与分析

P2P网络中一种基于进化博弈的资源配置模型

Tor匿名通信流量在线识别方法

基于动态定价策略的数据中心能耗成本优化

面向缺失数据的数据匿名方法

副本协作预取中文件相关性查询机制

考虑失效恢复的组合服务性能建模与分析

LBSN中基于元路径的兴趣点推荐

新浪微博网信息传播分析与预测

基于社会属性的PSN消息路由算法

一种基于k-核的社会网络影响最大化算法

在线社交网络中地域性话题发现

无线Mesh网络中满足带宽需求的路由器部署方法

基于PBAC模型和IBE的医疗数据访问控制方案

针对SSH匿名流量的网站指纹攻击方法

基于多维特征分析的社交网络意见领袖挖掘

Energy-Aware Dynamic Server Provisioning and Frequency Adjustment in Multi-Tier Data Centers

云计算环境下支持复杂查询的多维数据索引机制.

基于网络编码的多射频Mesh网组播时延建模与分析

一种具有GQoP保证的网格QoS自适应调度算法

Partition-Based Online Aggregation with Shared Sampling in the Cloud

Scheduling of scientific workflow in non-dedicated heterogeneous multicluster platform

多射频无线Mesh网络组播端到端时延建模与优化

基于排队Petri网的服务系统性能建模与分析方法

OLAP聚集计算中的维存储技术

基于数据中心负载分析的自适应延迟调度算法

P2P网络中一种基于进化博弈的资源配置模型

Tor匿名通信流量在线识别方法

一种适合低连接度拓扑的集中式保护路由机制

一种基于执行力模型的服务平台自主控制方法

基于动态定价策略的数据中心能耗成本优化

基于时隙质心流水印的匿名通信追踪技术

网格虚拟组织副本协作预取机制

一种基于选择性协同学习的网络用户异常行为检测方法

移动互联网：终端、网络与服务

云计算：体系架构与关键技术

面向网络状态的自适应用户行为评估方法

云计算环境下QoS偏好感知的副本选择策略

可信可控网络中的QoS资源控制模型

面向机会社会网络的服务广告分发机制

考虑失效恢复的组合服务性能建模与分析

现代物流系统中基于路径的RFID立方体构建方法

马尔科夫链在弥苴河总氮量预测中的应用

基于有向通信网络的链路重要性评价方法

基于GABP技术的PCA弥苴河水质预测

基于公共本体的高效语义服务发现

洋葱路由追踪技术中时间特征的建模与分析

Partition-Based Online Aggregation with Shared Sampling in the Cloud

面向缺失数据的数据匿名方法

一种基于选择性协同学习的网络用户异常行为检测方法

LBSN中基于元路径的兴趣点推荐

新浪微博网信息传播分析与预测

基于社会属性的PSN消息路由算法

一种基于k-核的社会网络影响最大化算法

在线社交网络中地域性话题发现

跨数据中心的动态资源联合预留研究

无线Mesh网络中满足带宽需求的路由器部署方法

基于PBAC模型和IBE的医疗数据访问控制方案

针对SSH匿名流量的网站指纹攻击方法

多跳无线网络中能耗优化和QoS约束的射频接口调度

基于路由证据的域间路由不一致路径恶意自治系统检测机制

一种面向多用户的负载感知动态服务选择模型

Efficient Location-Aware Data Placement for Data-Intensive Applications in Geo-distributed Scientific Data Centers

一种面向域间路由系统的信任模型

基于多维特征分析的社交网络意见领袖挖掘

包间隔流关联技术中的同步问题研究

一种基于进程验证的Petri网可达性判定方法

股市交易网络模型构建及其稳定性研究

基于发布/订阅机制的Web服务QoS信息分发模型

基于可信度的域间路由机制

基于Agent和蚁群算法的分布式服务发现

基于博弈论的网络控制模型及稳定性分析

基于可信可控网络的流量工程与覆盖网路由的合作博弈模型

洋葱路由追踪技术中时间特征的建模与分析

金融市场跳跃效应与传染效应研究综述

基于滤子理论的信用风险传染模型

后危机时代金属期货价格集体上涨——市场需求还是投机泡沫

基于语义的可扩展web服务注册与发现机制

基于无偏Q值反馈的社区划分算法

基于网络编码的多射频Mesh网组播时延建模与分析

一种具有GQoP保证的网格QoS自适应调度算法

Partition-Based Online Aggregation with Shared Sampling in the Cloud

可控网络中多agent系统信念可达性和收敛速度分析

具有QoS保证的服务资源联合分配与管理

干扰约束和负载均衡的无线Mesh网络网关部署策略

多射频无线Mesh网络组播端到端时延建模与优化

基于排队Petri网的服务系统性能建模与分析方法

OLAP聚集计算中的维存储技术

基于数据中心负载分析的自适应延迟调度算法

P2P网络中一种基于进化博弈的资源配置模型

Tor匿名通信流量在线识别方法

一种适合低连接度拓扑的集中式保护路由机制

一种基于执行力模型的服务平台自主控制方法

基于动态定价策略的数据中心能耗成本优化

一种基于波动类型识别的路由节点行为预测算法

面向缺失数据的数据匿名方法

副本协作预取中文件相关性查询机制

基于时隙质心流水印的匿名通信追踪技术

网格虚拟组织副本协作预取机制

直觉模糊群决策中专家权重确定的一种精确方法

基于Box-Cox SCD模型的价格持续期研究

高校招生考试满意度的测度模型与实证分析

一种基于选择性协同学习的网络用户异常行为检测方法

移动互联网：终端、网络与服务

云计算：体系架构与关键技术

面向网络状态的自适应用户行为评估方法

云计算环境下QoS偏好感知的副本选择策略

可信可控网络中的QoS资源控制模型

一种工作流环境下能耗感知的多路径服务组合方法

面向机会社会网络的服务广告分发机制

考虑失效恢复的组合服务性能建模与分析

LBSN中基于元路径的兴趣点推荐

新浪微博网信息传播分析与预测

基于社会属性的PSN消息路由算法

一种基于k-核的社会网络影响最大化算法

在线社交网络中地域性话题发现

跨数据中心的动态资源联合预留研究

一种网络钓鱼检测的体系结构及算法（英文）

针对SSH匿名流量的网站指纹攻击方法

基于URL特征的Phishing检测方法

一种面向多用户的负载感知动态服务选择模型

PKI/CA技术在PDS系统中的实现与部署

可靠广播单组传输次数的期望

VDI私有云基于容量承载算法的性能设计

无线网络对抗关键技术研究综述

基于融合网络播存机制的数据发布模式研究

信任本体的形式化语义研究

基于多维决策属性的分布式双向信任链发现算法

IET的生产者服务业与先进制造业耦合机理

ESnet架构、建设进展及其与CSTnet的比较

随机条件久期模型的贴近度新息构建方法

基于公共本体的高效语义服务发现

NDN安全机制初探

两种基于双向比较的最长公共子串算法

基于多维特征分析的社交网络意见领袖挖掘

期刊信息

《计算机研究与发展》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国科学院计算技术研究所
主编：徐志伟
地址：北京市科学院南路6号中科院计算所
邮编：100190
邮箱：crad@ict.ac.cn
电话：010-62620696 62600350

国际标准刊号：ISSN：1000-1239
国内统一刊号：ISSN：11-1777/TP
邮发代号:2-654

获奖情况:
2001-2007百种中国杰出学术期刊，2008中国精品科...,中国期刊方阵“双效”期刊

国内外数据库收录:
俄罗斯文摘杂志,荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:40349