东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

一种近似等频离散化方法

期刊名称：暨南大学学报(自然科学与医学版)
时间：0
页码：143-147
语言：中文
分类：TP311.13[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]广东外语外贸大学信息学院,广东广州510006
相关基金：国家自然科学基金项目（60673191）;广东省高等学校自然科学研究重点项目（062012）;广东外语外贸大学科研创新团队项目（GW2006-TA-005）致谢：感谢陈宁同学实现了本文部分算法.
相关项目：面向数据流的异常挖掘算法研究

作者：蒋盛益|李霞|郑琪|

关键词：正态分布, 离散化, 等频方法, normal distribution, discretization, equal frequency method

中文摘要：

在数据挖掘和机器学习研究中，许多算法以离散值为处理对象，常常需要对连续属性进行离散化。由于正态分布的广泛性，本文提出一种基于正态分布的近似等频离散化方法。该方法实现简单，关于数据集大小具有线性时间复杂度，适用于大规模数据集。在许多数据集上与文献中多个离散化方法进行了对比测试，实验结果表明，提出的无指导的离散化方法是有效、可行的。

英文摘要：

Many algorithms for data mining and machine learning require that training examples contain only discrete attributes. In order to use these algorithms when some attributes have numeric attributes, the numeric attributes must be converted into discrete attributes. Because of the extensiveness of normal distribution, an approximate equal frequency discretization method which based on normal distribution is presented. The method is simple to implementation. Time complexity of the presented discretization method is nearly linear with the size of dataset and can be used to large dataset. The experimental results on real datasets show that the discretization method is effective and practicable.

同期刊论文项目

面向数据流的异常挖掘算法研究

期刊论文 53 会议论文 21 著作 1

同项目期刊论文

基于代价敏感的朴素贝叶斯不平衡数据分类研究

基于聚类的电信客户细分

基于聚类和信息熵的特征选择算法

混合属性相关度计算方法研究

基于情感的音乐检索综述

Chameleon算法的改进

基于区间值Vague集的多属性模糊决策方法

我国反洗钱问题综述

基于机器学习的上市公司财务预警模型的构建

基于 Vague 双向近似推理的系统决策方法

A note on interval-valued fuzzy rough sets and interval-valued intuitionistic fuzzy sets

基于竞争协同进化的改进遗传算法

基于聚类和Ripper的稀有类分类方法

协同进化在遗传算法中的应用述评

初始码字间距最大化的矢量量化码书设计算法

存储网络高可用系统设计关键技术研究

一种高效异常检测方法

模糊马尔可夫链预测模型及其应用

双机高可用系统设计与性能分析

存储网络自适应容错协议和算法的研究

一种改进的BIRCH聚类算法

存储网络自适应容错技术研究

分布式式安全存储技术研究

A note on information entropy measures for vague sets and its applications

基于变异的紧凑遗传算法

基于新的空胞腔策略的矢量量化码书设计方法

应用协同进化的图像矢量量化码书设计方法

基于聚类的特征选择方法

NASSN: A NAS-based storage network

基于 IP 的高可用海量网络存储系统设计

一种新型的全局优化算法——细胞膜优化算法

一种高效混合属性离群检测算法

硬实时系统中基于任务同步及节能的动态调度算法

多处理器环境中基于节能及容错的实时动态调度算法

能量限制下基于效用获取的实时节能调度算法

On Weighted Possibilistic Mean, Variance and Correlation of Interval-valued Fuzzy Numbers

基于IP的高可用海量网络存储系统的研究

面向分类特征的无监督特征选择方法研究

个性化跨语言学术搜索技术研究

Web搜索结果多层聚类方法研究

一种基于名词短语的检索结果多层聚类方法

基于模式与规则寻找的数据挖掘研究

一种基于支持向量机的模糊分类器

一种基于模糊核超球感知器的模糊分类模型

概率后缀树在入侵检测中的应用研究

音乐情感自动分析研究

两个无证书代理签名方案的密码学分析

基于混沌置乱和混沌加密的DCT域数字水印算法

一种门限多代理多签名方案的内部攻击

我国反洗钱问题研究

Research on the Bit Computation Model for Time Variable Channel Bandwidth