东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于聚类改进的KNN文本分类算法

ISSN号：1001-3695
期刊名称：《计算机应用研究》
时间：0
分类：TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：中南大学软件学院,长沙410075
相关基金：国家自然科学基金资助项目（61379057,61309001,61379110,61103202,61301136）;国家教育部博士点基金优先发展领域课题（20120162130008）

作者：周庆平, 谭长庚, 王宏君, 湛淼湘

关键词：文本分类, KNN, 聚类化, 训练集, text classification , KNN , clustering , training set

中文摘要：

传统的KNN文本分类算法是一种无监督的、无参数的、简单的、较流行的且容易实现的分类算法。但是KNN算法在处理文本分类的过程中需要不断地计算待测文本与样本的相似度,当文本数量更大时,算法的效率就会更差。为了提高传统KNN算法在文本分类中的效率,提出一种基于聚类的改进KNN算法。算法开始之前采用改进χ~2统计量方法进行文本特征提取,再依据聚类方法将文本集聚类成几个簇,最后利用改进的KNN方法对簇类进行文本分类。实验对比与分析结果表明,该方法可以较好地进行文本分类。

英文摘要：

The traditional KNN text classification algorithm is a classification method which is an unsupervised, no parame- ters, simply, more popular and it＇s easily to achieve. But it need to constantly calculate the similarity between the test and sample text sets, when larger amounts of the text, the efficiency will be much more worse. To improve the classification effi- ciency of the traditional KNN algorithm, this paper proposed an improved KNN algorithm based on the clustering. Before this algorithm, it used an improved X2 statistics way to extract the feature of texts, then making the text sets into several clusters based on clustering method, at last it used the improved KNN way to classify the texts. The experiment and analysis results show that this algorithm can better deal with the text classification.

同期刊论文项目

无线传感器网络中抵御洞攻击的机制与方法研究

期刊论文 12

行为经济学在分布式系统合作性中的研究

期刊论文 10

模糊本体知识建模方法与语义信息服务策略研究

期刊论文 7

机会网络移动规律自适应的协同传输机制及技术研究

期刊论文 22

无线Mesh网络网关负载均衡关键技术研究

期刊论文 21 会议论文 1

同项目期刊论文

Impact of Topology and Traffic on Interference and Routing in IEEE 802.11 Wireless Mesh Network

A Research on HCCA Mechanism of Wireless LAN Access

基于最大覆盖集的无线传感器网络节能策略研究

分区域的医学图像高容量无损信息隐藏方法

Delay Variation Optimized Traffic Allocation Based on Network Calculus for Multi-path Routing in Wir

<span style="color:#000000;background-color:#FFFFFF;">An Interior Point Method for L

WMN中基于网关饥饿度的部署算法优化

改进的块差值无损鲁棒图像水印算法

基于可逆可见水印的医学图像隐私保护算法

高效的基于身份签名方案的安全性分析

染色体片段交叉重组的频谱分配遗传算法

无线Mesh网中一种流量感知和干扰优化的信道分配机制

移动群体感知中基于社会关系的路由算法

Hadoop平台中一种Reduce负载均衡贪心算法

一种基于特征值的多天线认知无线电盲感知算法

基于机会网络有效数据预测转发路由算法

基于移动医疗大数据平台下降低能量消耗机会网络的研究与应用

基于机会网络中社交关系的转发机制

基于异或运算的机会网络高效转发策略

染色体片段交叉重组的频谱分配遗传算法

无线Mesh网中一种流量感知和干扰优化的信道分配机制

基于机会网络有效数据预测转发路由算法

基于移动医疗大数据平台下降低能量消耗机会网络的研究与应用

基于机会网络中社交关系的转发机制

基于异或运算的机会网络高效转发策略

社交网络用户的情感预测方法研究

树形传感网络中一种不等概率标记追踪策略

Delay optimization for planar wireless sensor network with N-policy

链路质量与负载敏感的无线Mesh网络路由协议

基于时间序列分析的网络安全态势预测

认知无线Mesh网络中满足QoS的高吞吐量安全路由协议

染色体片段交叉重组的频谱分配遗传算法

无线Mesh网中一种流量感知和干扰优化的信道分配机制

基于机会网络有效数据预测转发路由算法

基于移动医疗大数据平台下降低能量消耗机会网络的研究与应用

基于机会网络中社交关系的转发机制

基于异或运算的机会网络高效转发策略

Sparse Support Vector Machine with Lp Penalty for Feature Selection

社交网络用户的情感预测方法研究

Delay optimization for planar wireless sensor network with N-policy

基于社区与社会性的机会网络路由算法

像素位置与比特双重置乱的图像混沌加密算法

机会网络蓝牙设备唤醒调度机制研究

基于超混沌映射的医学图像小波域加密算法

基于聚类分析的网络安全态势评估方法

面向社交大数据的个体行为信任评价

机会网络多跳节点最小传输延迟算法设计

A chaos-based quantum group signature scheme in quantum cryptosystem

染色体片段交叉重组的频谱分配遗传算法

无线Mesh网中一种流量感知和干扰优化的信道分配机制

基于机会网络有效数据预测转发路由算法

基于移动医疗大数据平台下降低能量消耗机会网络的研究与应用

基于机会网络中社交关系的转发机制

基于异或运算的机会网络高效转发策略

社交网络用户的情感预测方法研究

基于社区与社会性的机会网络路由算法

HDFS平台上以能效为考量的小文件合并

计算机系统能耗估量模型研究

使用宽裕时间有效分配优化工作流逆向分层算法

汽车防撞雷达MFSK信号应用仿真研究

MOOC环境下学习伙伴匹配问题研究

Word Net-based lexical semantic classification for text corpus analysis

期刊信息

《计算机应用研究》
北大核心期刊（2011版）

主管单位:四川省科学技术厅
主办单位:四川省计算机研究院
主编：刘营
地址：成都市成科西路3号
邮编：610041
邮箱：arocmag@163.com
电话：028-85210177 85249567

国际标准刊号：ISSN：1001-3695
国内统一刊号：ISSN：51-1196/TP
邮发代号:62-68

获奖情况:
第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:60049