东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于影响函数的k-近邻分类

ISSN号：1009-5896
期刊名称：《电子与信息学报》
时间：0
分类：TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
作者机构：[1]郑州大学信息工程学院,郑州450052
相关基金：国家自然科学基金（61170223）和河南省教育厅科学技术研究重点项目（14A520016）资助课题

作者：职为梅[1], 张婷[1], 范明[1]

关键词：数据挖掘, 监督学习, 非平衡数据集分类, 影响函数, K-近邻, Data mining, Supervised learning, Classification of imbalanced data sets, Influence function, k-Nearest Neighbor （kNN）

中文摘要：

分类是一种监督学习方法,通过在训练数据集学习模型判定未知样本的类标号。与传统的分类思想不同,该文从影响函数的角度理解分类,即从训练样本集对未知样本的影响来判定未知样本的类标号。首先介绍基于影响函数分类的思想;其次给出影响函数的定义,设计3种影响函数;最后基于这3种影响函数,提出基于影响函数的k-近邻（k NN）分类方法。并将该方法应用到非平衡数据集分类中。在18个UCI数据集上的实验结果表明,基于影响函数的k-近邻分类方法的分类性能好于传统的k-近邻分类方法,且对非平衡数据集分类有效。

英文摘要：

Classification is a supervised learning. It determines the class label of an unlabeled instance by learning model based on the training dataset. Unlike traditional classification, this paper views classification problem from another perspective, that is influential function. That is, the class label of an unlabeled instance is determined by the influence of the training data set. Firstly, the idea of classification is introduced based on influence function. Secondly, the definition of influence function is given and three influence functions are designed. Finally, this paper proposes k-nearest neighbor classification method based on these three influence functions and applies it to the classification of imbalanced data sets. The experimental results on 18 UCI data sets show that the proposed method improves effectively the k-nearest neighbor generalization ability. Besides, the proposed method is effective for imbalanced classification.

同期刊论文项目

多变量IB方法及算法的研究

期刊论文 48 会议论文 11

同项目期刊论文

非平衡数据集分类方法探讨

一种基于EFPN的电力系统故障诊断方法

Inverse matrix-free incremental proximal support vector machine

变电站故障诊断的时间不确定性问题研究

一种基于贝叶斯Petri网的故障诊断方法

基于时间贝叶斯Petri网的溯因故障诊断

虚拟网络马拉松——探索健身游戏的设计与实现

Analysis of real-time system conflict based on fuzzy time Petri nets

Collective crowd formation transform with mutual information-based runtime feedback

Unsupervised video categorization based on multivariate information bottleneck method

Incorporating side information into multivariate information bottleneck for generating alternative c

基于样本权重的出租车聚集区识别算法

非共现数据的二元化加权转化算法

因果链解耦的时间-概率模型

基于信息瓶颈方法的出租车空载区聚类算法

一种信息物理融合系统行为预测模型

Character behavior planning and visual simulation in virtual 3D space

模糊离散事件系统时间维度可诊断性分析

融入情绪模型的人群实时路径规划

Instance-based ensemble pruning for imbalanced learning

一种面向非平衡数据集分类问题的组合选择方法

基于EFPN的模糊离散事件系统可诊断性分析

基于有色Petri网的变电站监控数据版本控制建模与研究

因果链解耦的时间—概率模型

基于信息瓶颈方法的出租车空载聚集区聚类算法

AA-FVDM: An accident-avoidance full velocity difference model for animating realistic street-level t

非共现数据两阶段加权IB算法

A combination weighting algorithm using relative entropy for document clustering

基于模糊有色Petri网的故障诊断方法

基于混杂系统的电力设备状态感知与趋势分析

基于数据选择模型的IB算法

A hybrid model of behavior forecasting for cyber-physical systems

Mutual information evaluation: A way to predict the performance of feature weighting on clustering

基于最大化交叉互信息的对称IB算法

基于信息瓶颈的变压器故障诊断算法

面向时间序列分类任务的SAX方法特性及可视化探索

一种基于LoG算子的无标识增强现实算法：LoG-PTAMM

基于序的空间金字塔池化网络的人群计数方法

一种基于TC-CPN的城轨列车车门故障溯因诊断方法

一种特征加权的顺序IB算法

多视角生成模型的可解释性聚类

基于并行信息瓶颈的多语种文本聚类算法

期刊信息

《电子与信息学报》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国科学院电子学研究所国家自然科学基金委员会信息科学部
主编：朱敏慧
地址：北京市北四环西路19号
邮编：100190
邮箱：jeit@mail.ie.ac.cn
电话：010-58887066

国际标准刊号：ISSN：1009-5896
国内统一刊号：ISSN：11-4494/TN
邮发代号:2-179

获奖情况:

国内外数据库收录:
荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:24739