东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于相关分析的多数据流聚类

ISSN号：1000-9825
期刊名称：《软件学报》
时间：0
分类：TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
作者机构：[1]南京航空航天大学信息科学与技术学院,江苏南京210093, [2]扬州大学计算机科学与工程系,江苏扬州225009, [3]南京大学计算机软件新技术国家重点实验室,江苏南京210093
相关基金：Supported by the National Natural Science Foundation of China under Grant Nos.60673060, 60773103 ; the Natural Science Foundation of Jiangsu Province of China under Grant No.BK2008206

中文摘要：

提出基于相关分析的多数据流聚类算法．该算法将多数据流的原始数据快速压缩成一个统计概要．根据这些统计概要，可以增量式地计算相关系数来衡量数据间的相似度．提出了一种改进的k-平均算法来生成聚类结果．改进的缸平均算法可以动态、实时地调整聚类数目，并及时检测数据流的发展变化．还将算法应用到按照用户要求的聚类问题（COD），使得用户可以在任意的时间区间上查询聚类结果．提出了一种合理的时间片断划分机制，使得用户指定的任意时间区间都可以由这些时间片断组合而成．在模拟和真实数据上的实验结果都表明，该算法比其他方法具有更好的聚类质量、速度和稳定性，能够实时地反映数据流的变化．

英文摘要：

This paper proposes a compression scheme which quickly compresses the raw data from multiple streams into a compressed synopsis. The synopsis allows to incrementally reconstruct the correlation coefficients without accessing the raw data. A modified k-means algorithm is developed to generate clustering results and dynamically adjust the number of clusters in real time so as to detect the evolving changes in the data streams. Finally, the framework is extended to support clustering on demand （COD）, where a user can query for clustering results over an arbitrary time horizon. A theoretically sound time-segment partitioning scheme is developed so that any demand time horizon can be fulfilled by a combination of those time-segments. Experimental results on synthetic and real data sets show that the algorithm has higher clustering quality, speed and stability than other methods and can detect the evolving changes of the data streams in real time.

同期刊论文项目

基于网格环境的高维OLAP数据联机分析与处理技术研究

期刊论文 56 会议论文 8 获奖 4 专利 1

蚁群优化算法的理论基础研究

期刊论文 105 会议论文 50 专利 1

同项目期刊论文

蚁群算法解决连续优化问题的新途径

一种基于进程验证的Petri网可达性判定方法

一种可信可控的网络体系及协议结构

数据流的网格密度聚类算法

基于蚁群优化的系统发生树构建算法

基于蚁群优化的电信通话圈划分算法

射频识别数据库中封闭多维路径挖掘

A novel task scheduling algorithm based on dynamic critical path and effective duplication for perva

一种高效的基于位图序列模式挖掘算法

基于发布/订阅机制的Web服务QoS信息分发模型

基于Agent和蚁群算法的分布式服务发现

NETOP: a Non-cooperative game based Topology OPtimization model towards improving search performance

一种具有 GQoP 保证的网格 QoS自适应调度算法

跨虚拟组织的动态网格资源联合预留研究

A Grid Information Services Architecture Based on Structured P2P Systems

Grid Service Discovery Based on Cross－VO Service Domain Model

一种面向物流数据分析的路径序列挖掘算法ImGSP

现代物流系统中路径编码及频繁路径挖掘技术研究

A Scalable and Adaptive Distributed Service Discovery Mechanism in SOC Environments

基于概念格模型的本体映射

基于语义的可扩展web服务注册与发现机制

基于多目标粒子群优化的服务选择算法

一种具有GQoP保证的网格QoS自适应调度算法

一种有效的基于密度度量的相交网格划分聚类算法

A Context-aware Personalized Resource Recommendation for Pervasive Learning

A Resilient P2P Anonymous Routing Approach Employing Collaboration Scheme

现代物流系统中的频繁封闭路径挖掘算法

基于回归的多层数据立方体中的异常发现算法

具有QoS保证的服务资源联合分配与管理

分布式环境下全局序列模式挖掘技术研究

DHMC：一种有效的高维Cube并行分布式存储结构

基于数据中心负载分析的自适应延迟调度算法

云计算：体系架构与关键技术

基于XML WEB SERVICE的数字图书馆统一检索技术研究

基于嵌套EMD的钓鱼网页检测算法

Petri网的资源损益单调进程段研究

基于TSP的构建系统发生树的蚁群算法

功能原子化的自适应木马模型研究

系统发生树构建方法综述

多方不可否认协议时限性分析与改进

数据仓库中一种有效的高维联机分析处理方法

马尔科夫链在弥苴河总氮量预测中的应用

一种网络钓鱼检测的体系结构及算法（英文）

基于正交试验设计的粒子群优化算法

A Novel Ant Clustering Algorithm Based on Cellular Automata.

求解多处理机调度问题的蚁群算法

并行蚁群算法中的自适应交流策略(英文)

First Order Deceptive Problem of ACO and Its Performance Analysis

Stream Data Classification Using Improved Fisher Discriminate Analysis

RAPWBN计算模型上的快速并行归并排序算法

蚁群算法解决连续优化问题的新途径

基于遗传算法的系统发生树构建方法

数据流的网格密度聚类算法

潜在属性空间树分类器

基于相关分析的多数据流聚类(英文)

基于蚁群优化的系统发生树构建算法

基于蚁群优化的电信通话圈划分算法

射频识别数据库中封闭多维路径挖掘

一种高效的基于位图序列模式挖掘算法

A fast parallel algorithm for finding the longest common sequence of multiple biosequences

多重序列比对的蚁群算法

An improved ant colony algorithm with diversified solutions based on the immune strategy

A novel approach to phylogenetic tree construction using stochastic optimization and clustering

蚁群算法一阶欺骗性问题的时间复杂度分析

一种面向物流数据分析的路径序列挖掘算法ImGSP

现代物流系统中路径编码及频繁路径挖掘技术研究

分布式环境下全局模式挖掘技术研究

基于路径编码的 RFID 数据压缩技术研究

一种基于蚁群原理的聚类算法

基于单维分割的高维聚类算法， HDCA_SDP

基于概念格模型的本体映射

一种有效的基于密度度量的相交网格划分聚类算法

现代物流系统中的频繁封闭路径挖掘算法

基于回归的多层数据立方体中的异常发现算法

基于概念格的 Web 文本聚类

A parallel algorithm for gene expressing data biclusterin g

一种RFID位置序列挖掘方法

P2P模拟器的比较研究

一种基于距离调节的聚类算法

一种基于谱分量相似度的多数据流聚类算法(英文)

一种快速的频繁子图挖掘算法

Word服务器的接口解析与文档属性提取

电信客户服务需求的关联规则挖掘

一种改进的可扩展标记语言查询增量维护算法

Clustering algorithm for multiple data streams based on spetral component similarity

Mining frequent subgraph by incidence matrix normalization

Word自动阅卷系统的设计与实现

一种基于概念格的本体合并方法

多关系频繁项集的并行获取

An efficient algorithm for multiple sequence alignment based on ant colony optimisation and divide-a

分布式环境下全局序列模式挖掘技术研究

多数据流的实时聚类算法

基于 XML 的数据交换技术与实现

序列模式挖掘算法综述

Adaptive Clustering Algorithm by Ant Optimization

A Prefix-Indexing Hierarchical Cubing Approach for High-Dimensional OLAP

数据仓库系统中一种高效的多维层次聚集算法

基于TSP的构建系统发生树的蚁群算法

系统发生树构建方法综述

基于正交试验设计的粒子群优化算法

基于用户查询扩展的自动摘要技术

点与三角形位置关系对三角网格拓扑的影响

基于分类技术的用户意向挖掘

一种Web商务智能语义平台及时序知识模型

基于超混沌系统的图像加密方案

综合项目评分和属性的个性化推荐算法

研究生学习热情与专业满意度的相关性研究

基于情感词识别的BBS情感分类研究

利用量化规则格分布获取关联规则

约束Delaunay三角网格生成地质构造模型

基于XTR体制的电子现金支付方案

基于正例和未标文档的半监督分类研究

运用数据挖掘方法分析学习者学习特征

基于信息熵的主动学习半监督分类研究

Adaptive Clustering Algorithm by Ants＇ Optimization

一种基于谱分量相似度的多数据流聚类算法

并行蚁群算法中的自适应交流策略

基于概念格的web log分布式挖掘算法

基于概念格的Web文本聚类

一种基于核映射空间距离的入侵检测算法

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609