面向数据流的异常挖掘算法研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

面向数据流的异常挖掘算法研究

项目名称：面向数据流的异常挖掘算法研究
项目类别：面上项目
批准号：60673191
申请代码：F020509
项目来源：国家自然科学基金
研究期限：2007-01-01-2009-12-31

项目负责人：蒋盛益
负责人职称：教授
依托单位：广东外语外贸大学
批准年度：2006

中文摘要：

异常挖掘在许多领域中具有很高的实用价值，可用来避免或减少不必要的损失。本项目针对大规模数据集和数据流的特点，以研究面向大规模数据集和数据流的高精度、高效率聚类算法为基础，设计基于聚类的异常挖掘算法和分类算法；由于异常数据挖掘与稀有类分类之间存在一定的共性，对稀有类的分类进行了研究；考虑到数据预处理的需要，进行了数值属性离散化、特征选择方面的研究；同时将数据流异常挖掘应用于入侵检测和欺诈检测等实际领域。设计了一组具有近似线性时间复杂度并可以识别任意形状数据的聚类算法；设计了无监督的近似等频和基于局部密度的离散化方法，其性能接近经典的有监督离散化方法；对特征选择进行了深入研究，提出了几种有效的有监督和无监督的特征选择方法；提出了连续特征与离散特征之间相关性度量问题，并进行了初步研究，设计了一种度量混合特征相关性的方法，将之应用于特征选择，取得了很好的结果；将C4.5、Ripper等分类算法与聚类算法结合，使之在不平衡数据集上的分类性能明显提高。实验表明，我们提出的算法在可扩展性、时效性、准确性和自适应性等方面有很好的性能。

中文主题词：高效聚类算法;异常挖掘;特征选择;不平衡分类

结论摘要：

英文主题词high-efficient clustering algorithm, outlier mining, feature selection, imbalanced classification

成果综合统计

期刊论文
会议论文
专利
获奖
著作

53
21
0
0
1

基于代价敏感的朴素贝叶斯不平衡数据分类研究

基于聚类的电信客户细分

一种近似等频离散化方法

Chameleon算法的改进

基于区间值Vague集的多属性模糊决策方法

我国反洗钱问题综述

基于机器学习的上市公司财务预警模型的构建

基于 Vague 双向近似推理的系统决策方法

A note on interval-valued fuzzy rough sets and interval-valued intuitionistic fuzzy sets

基于竞争协同进化的改进遗传算法

基于聚类和Ripper的稀有类分类方法

协同进化在遗传算法中的应用述评

初始码字间距最大化的矢量量化码书设计算法

存储网络高可用系统设计关键技术研究

一种高效异常检测方法

模糊马尔可夫链预测模型及其应用

双机高可用系统设计与性能分析

存储网络自适应容错协议和算法的研究

一种改进的BIRCH聚类算法

存储网络自适应容错技术研究

分布式式安全存储技术研究

基于新的空胞腔策略的矢量量化码书设计方法

基于聚类的特征选择方法

一种新型的全局优化算法——细胞膜优化算法

一种高效混合属性离群检测算法

硬实时系统中基于任务同步及节能的动态调度算法

多处理器环境中基于节能及容错的实时动态调度算法

能量限制下基于效用获取的实时节能调度算法

On Weighted Possibilistic Mean, Variance and Correlation of Interval-valued Fuzzy Numbers

面向分类特征的无监督特征选择方法研究

个性化跨语言学术搜索技术研究

Web搜索结果多层聚类方法研究

一种基于名词短语的检索结果多层聚类方法

基于模式与规则寻找的数据挖掘研究

一种基于支持向量机的模糊分类器

一种基于模糊核超球感知器的模糊分类模型

概率后缀树在入侵检测中的应用研究

音乐情感自动分析研究

两个无证书代理签名方案的密码学分析

基于混沌置乱和混沌加密的DCT域数字水印算法

Research on the Bit Computation Model for Time Variable Channel Bandwidth

我国反洗钱问题研究

一种门限多代理多签名方案的内部攻击

应用协同进化的图像矢量量化码书设计方法

基于IP的高可用海量网络存储系统的研究

基于 IP 的高可用海量网络存储系统设计

NASSN: A NAS-based storage network

基于变异的紧凑遗传算法

A note on information entropy measures for vague sets and its applications

基于情感的音乐检索综述

混合属性相关度计算方法研究

基于聚类和信息熵的特征选择算法

会议论文

A novel fuzzy classifier ensemble system

A method of generating rules for a kernel fuzzy classifier

A Hybrid Clustering Algorithm

Research on theory and experiment of a high performance storage network

Research on the high availability storage network

A P2P network traffic classification method using SVM

A Combination Classification Algorithm Based on Outlier Detection and C4.5

Framework of Clustering-Based Outlier Detection

基于OWA算子的区间值模糊决策方法

An interval-valued fuzzy reasoning algorithm based on OWA operator

Interval-valued fuzzy reasoning with interval-valued fuzzy truth

STATISTICAL CORRELATION OF INTUITIONISTIC FUZZY SETS

Approximate Equal Frequency Discretization Method

A Local Density Approach for Unsupervised Feature Discretization

A Novel Fast Clustering Algorithm

Interval-valued intuitionistic fuzzy approximate reasoning based on a new similarity measure

A fuzzy classification model with SVM

A KFCM-based fuzzy classifier

Clustering-Based Outlier Detection Method

Approaches of Individual Classifier Generation and Classifier Set Selection for Fuzzy Classifier Ens

Research on self-adaptive distributed storage system

著作

基于聚类的入侵检测算法研究

相关项目

隐喻识别与理解的理论与方法研究

期刊论文 19 会议论文 15

面向不平衡数据的学习算法及应用研究

期刊论文 37 会议论文 4

基于鉴别特征分析的遥感图像检索方法研究

期刊论文 22 会议论文 5 获奖 1

图像分类中的局部泛化误差SVM特征和样本选择方法

期刊论文 6 会议论文 7

模式识别的特征选取Lasso改进方法与应用研究

期刊论文 20 会议论文 3

类噪声环境下特征选择算法研究

期刊论文 6 会议论文 10

交互协作特征选择方法及其在立体视觉中的应用研究

期刊论文 5 会议论文 4

基于能量学习的特征选择方法及其应用研究

期刊论文 23 会议论文 6 专利 2

多标记数据特征选择及其应用的研究

期刊论文 16 会议论文 13 获奖 2

蒋盛益的项目

　面向微博公共事件的社会情绪评估方法及应用研究

　面向微博公共事件的社会情绪评估方法及应用研究

面向不平衡数据的学习算法及应用研究

期刊论文 37 会议论文 4

　面向微博公共事件的社会情绪评估方法及应用研究

面向微博公共事件的反向社会情绪识别及演化分析研究

期刊论文 8