东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

文本分类中基于K-means的类偏斜KNN样本剪裁

ISSN号：1000-7180
期刊名称：《微电子学与计算机》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]解放军理工大学理学院,江苏南京210007
相关基金：国家自然科学基金项目（71071161）

作者：刘海峰[1], 姚泽清[1], 苏展[1], 张学仁[1]

关键词： K最近邻, 类偏斜, 样本剪裁, 聚类, K-nearest neighbor, category deflection, sample selection, clustering

中文摘要：

KNN算法是经典的文本分类算法．训练样本的数量和类别密度是影响算法性能的主要瓶颈，合理的样本剪裁可以提高分类器效率．文中提出了一种基于聚类的改进KNN分类模型．首先对训练集进行聚类，基于测试样本与簇之间的相对位置对训练集进行合理裁剪以节约计算开销；然后基于簇内样本分布进行样本赋权，改善大类别样本的密度占优现象．实验结果表明，本文提出的样本剪裁方法提高了KNN算法的分类性能．

英文摘要：

KNN is one of the classical algorithms in text categorization. The number of training samples and the density is the primary bottleneck on the algorithm. A reasonable method for reducing the amount of training data can improve the efficiency of classification. This paper proposes an improved KNN model basing on clustering. Firstly, by clustering the samples into clusters, we remove some samples from training set basing on the distance in order to save computing cost. Secondly, take into account the category distribution we bring up a better weighting method in order to overcome the defect that the bigger class of training samples dominated in KNN. The result of test shows that the improved KNN classification algorithm improves the efficiency of its classification.

同期刊论文项目

直觉模糊聚类理论及其应用

期刊论文 62 著作 2

同项目期刊论文

Approaches to multi-stage multi-attribute group decision making

An error-analysis-based method for the priority of an intuitionistic preference relation in decision

Correlation coefficients of hesitant fuzzy sets and their applications to clustering analysis

Compatibility measures and consensus models for group decision making with intuitionistic multiplica

Approaches to multiple attribute group decision making based on intuitionistic fuzzy power aggregati

Interval-valued hesitant preference relations and their applications to group decision making

Uncertain power average operators for aggregating interval fuzzy preference relations

A game model based on multi-attribute aggregation

Priority weight intervals derived from intuitionistic multiplicative preference relations

On continuity of ordered aggregation operators

Hesitant fuzzy Bonferroni means for multi-criteria decision making

Geometric Bonferroni means with their application in multi-criteria decision making

A spectral clustering algorithm based on intuitionistic fuzzy information

Hesitant fuzzy multi-attribute decision making based on TOPSIS with incomplete weight information

Group decision making based on intuitionistic multiplicative aggregation operators

Intuitionistic fuzzy Bonferroni means

Some hesitant fuzzy aggregation operators with their application in decision making

Algorithms for improving consistency or consensus of reciprocal [0,1]-valued preference relations

Compatibility analysis of intuitionistic fuzzy preference relations in group decision making

Intuitionistic fuzzy analytic hierarchy process

A VIKOR-based method for hesitate fuzzy multi-criteria decision making

Multiplicative consistency-based decision support system for incomplete linguistic preference relati

Managing hesitant information in GDM problems under fuzzy and multiplicative preference relations

Group consensus algorithms based on preference relations

Distance and similarity measures for hesitant fuzzy sets

Methods for fuzzy complementary preference relations based on multiplicative consistency

Intuitionistic fuzzy multi-attribute decision making: An interactive method

Preference relations based on intuitionistic multiplicative information

Minimizing group discordance optimization model for deriving expert weights

Intuitionistic fuzzy MST clustering algorithms

Graph-based multi-agent decision making

Hesitant fuzzy entropy and cross-entropy and their use in multiattribute decision-making

Generalized intuitionistic fuzzy Bonferroni means

Multicriteria decision making with 2-dimension linguistic aggregation techniques

Directed graph-based multi-agent coalitional decision making

Some issues on intuitionistic fuzzy aggregation operators based on Archimedean t-conorm and t-norm

A consensus reaching process under incomplete multiplicative preference relations

A new method for ranking intuitionistic fuzzy values and its application in multi-attribute decision

Fuzzy ordered distance measures

Dual hesitant fuzzy sets

Prioritized intuitionistic fuzzy aggregation operators

Hesitant fuzzy information aggregation in decision making

Hesitant fuzzy geometric Bonferroni means

The ordered multiplicative modular geometric operator

A survey and prospects of OWA aggregation with intuitionistic fuzzy information

Intuitionistic fuzzy clustering algorithm based on Boole matrix and association measure

文本分类中基于训练样本空间分布的K近邻改进算法

一种基于互信息的改进文本特征选择

一种聚类模式下基于密度的改进KNN算法

基于灰关系与信息增益融合的文本分类模型

一种基于模糊加权的改进文本聚类方法

一种基于类别分布信息的文本特征选择模型

复合打击下的火力分配方案评估

一种基于词频信息的改进CHI文本特征选择

AGGREGATION AND DECISION MAKING USING INTUITIONISTIC MULTIPLICATIVE TRIANGULAR FUZZY INFORMATION

期刊信息

《微电子学与计算机》
中国科技核心期刊

主管单位:中国航天科技集团公司
主办单位:中国航天科技集团公司第九研究院第七七一研究所
主编：李新龙
地址：西安市雁塔区太白南路198号
邮编：710065
邮箱：mc771@163.com
电话：029-82262687

国际标准刊号：ISSN：1000-7180
国内统一刊号：ISSN：61-1123/TN
邮发代号:52-16

获奖情况:
航天优秀期刊,陕西省优秀期刊一等奖

国内外数据库收录:
荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:17909