东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

特征加权距离与软子空间学习相结合的文本聚类新方法

ISSN号：0254-4164
期刊名称：计算机学报
时间：0
页码：1655-1665
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]江南大学数字媒体学院,江苏无锡214122
相关基金：本课题得到国家自然科学基金（60903100,60975027,61170122）、江苏省自然科学基金（BK2011417）、江苏“333高层次人才培养工程”（BRA2011142）、中央高校基本科研业务专项资金项目（JUSRP111A38）资助.
相关项目：鲁棒的目标跟踪和识别新方法及在羽绒识别中的应用研究

作者：王骏|王士同|邓赵红|WANG Jun WANG Shi-Tong DENG Zhao-Hong(School of Di|

关键词：模糊聚类, 文本聚类, 软子空间, 特征加权距离, 全局收敛性, fuzzy clustering, text clustering, soft subspace, feature weighting distance, global convergence

中文摘要：

文本数据维数高、数据分布稀疏、不同类别的特征相互重叠,这为聚类分析提出了挑战.针对文本数据的这一特点,将特征加权技术与软子空间相结合,基于模糊聚类的算法框架,提出了一种适用于高维文本数据的软子空间模糊聚类新方法.首先,基于加权范数理论,提出了新的特征加权距离计算方法.接着,将其与软子空间学习的理论框架相结合,提出了面向模糊聚类的新的目标学习准则.通过向约束条件中引入熵指数r,从而扩展了模糊指数m的取值范围,并给出了物理解释.基于Zangwill收敛定理对算法的全局收敛性给出理论证明.实验表明,文中算法可以使软子空间学习和聚类分析同时进行,其性能比现有的相关算法有了较大的提高.

英文摘要：

The text data are characterized by high dimensionality and feature overlapping among different clusters, which is a great challenge for the real-world data mining applications. This paper proposes a novel fuzzy clustering algorithm by integrating the feature weighting metric into the framework of soft subspace learning. Firstly, the feature weighting metric is presented based on the concept of vector norm. Then a novel learning criterion is proposed based on the combination of feature weighting metric and soft subspace clustering. An entropy exponent r is intro- duced into the constraints so that the span of the fuzzy index m is extended. A physical explanation from the view of the information theory is given. A global convergence theory is also estab- lished by applying Zangwill＇s convergence theorem. At last, experiments are conducted on both synthesis and real text data and the experimental results show that the proposed algorithm can perform tasks of clustering analysis and soft subspace learning simultaneously and obtain better results than some of the existing approaches.

同期刊论文项目

超大规模发酵数据集驱动的模糊推理系统快速构建方法研究

期刊论文 71

鲁棒的目标跟踪和识别新方法及在羽绒识别中的应用研究

期刊论文 56

面向漂移过程的漂移模糊系统建模理论与方法及发酵过程应用研究

期刊论文 85

同项目期刊论文

基于光束角思想的最大间隔学习机

Dm-KDE: dynamical kernel density estimation by sequences of KDE estimators with fixed number of comp

An Improved TA-SVM Method Without Matrix Inversion and Its Fast Implementation for Nonstationary Dat

MSAFC: matrix subspace analysis with fuzzy clustering ability

T2FELA: type-2 fuzzy extreme learning algorithm for fast training of interval type-2 TSK fuzzy logic

Minimax Probability TSK Fuzzy System Classifier: More Transparent and High Interpretable Classifica

Knowledge-leverage-based fuzzy system and its modeling

Generalized hidden-mapping ridge regression, knowledge-leveraged inductive transfer learning for neu

Fuzzy partition based soft subspace clustering and its applications in high dimensional data

基于最小包含球的非静态大数据集的快速分类算法

适于渐变概念漂移数据的自适应分类算法

基于知识利用的迁移学习一般化增强模糊划分聚类算法

Knowledge-Leverage-Based TSK Fuzzy System Modeling

Minimax probability TSK fuzzy system classifier: a more transparent and highly interpretable classif

Takagi-Sugeno-Kang transfer learning fuzzy logic system for the adaptive recognition of epileptic el

Transfer prototype-based fuzzy clustering

Nonnegative matrix factorization with manifold regularization and maximum discriminant information

Privacy preserving and fast decision for novelty detection using support vector data description

Support vector machine with manifold regularization and partially labeling privacy protection

Kernel Density Estimation, Kernel Methods, and Fast Learning in Large Data Sets

Scaling up minimum enclosing ball with total soft margin for training on large datasets

融合异构特征的子空间迁移学习算法

具有协同约束的共生迁移学习算法研究

A virtual reality based simulator for learning nasogastric tube placement

Multitask TSK Fuzzy System Modeling by Mining Intertask Common Hidden Structure.

Multi-task TSK fuzzy system modeling using inter-task correlation information

Double indices-induced FCM clustering and its integration with fuzzy subspace clustering

基于迁移学习的癫痫EEG信号自适应识别

迁移组概率学习机

基于模糊子空间聚类的〇阶L2型TSK模糊系统

一种新的面向迁移学习的L_2核分类器

共享隐空间迁移SVM

面向共享数据的迁移组概率学习机

TL-SVM:一种迁移学习算法

最大间隔对数向量机

熵加权多视角协同划分模糊聚类算法

Transductive domain adaptive learning for epileptic electroencephalogram recognition

面向非静态数据分类的演进支持向量机

A SVM based classification method for homogeneous data

Multitask Coupled Logistic Regression and Its Fast Implementation for Large Multitask Datasets

基于最小包含球的异质空间大数据集快速相似度学习算法

非线性分类的分割超平面快速集成方法

基于ε-不敏感准则和结构风险的鲁棒径向基函数神经网络学习

基于LS-SVM与模糊补准则的特征选择方法

一种新的面向迁移学习的L2核分类器

基于概率密度分布一致约束的最小最大概率机图像分类算法

适用于不确定类标签数据学习的迁移支持向量机

基于点密度的半监督CA算法在图像聚类中的应用

基于临近像素空间距离的模糊C均值聚类算法

面向大规模数据的模糊支持向量数据描述

适合大规模数据集且基于LLM的0阶TSK模糊分类器

基于模糊子空间聚类的0阶岭回归TSK模糊系统

TL—SVM：一种迁移学习算法

基于0阶TSK型迁移模糊系统的EEG信号自适应识别

大样本多源域与小目标域的跨领域快速分类学习

一种基于同类约束的半监督近邻反射传播聚类方法

大样本领域自适应支撑向量回归机

增量式0阶TSK模糊分类器及鲁棒改进

Dm-KDE： dynamical kernel density estimation by sequences of KDE estimators with fixed number of components over data streams

基于最小包含球的大数据集域自适应快速算法

针对小样本数据集的鲁棒单隐层前馈网络建模方法

聚类分析研究中的若干问题

基于移相加权球面单簇聚类的周期时间序列异常检测

正交模糊k平面聚类算法

协作式整体和局部的分类机

快速核密度估计定理和大规模图论松弛聚类方法

基于稀疏Parzen窗密度估计的快速自适应相似度聚类方法

适合大样本快速训练的最大夹角间隔核心集向量机

基于最小最大概率分割准则的图像阈值分割方法

基于压缩集密度估计的ML模糊推理系统构建

基于特征加权距离的双指数模糊子空间聚类算法

SVDD的快速实时决策方法

具有磁场效应的大间隔支持向量机

支撑向量数据域描述优化问题最优解理论分析

L1范局部线性嵌入

基于最小包含球的大数据集快速谱聚类算法

基于知识利用的迁移学习一般化增强模糊划分聚类算法

最小学习机

大数据集快速均值漂移谱聚类算法

基于语境距离度量的拉普拉斯最大间距判别准则

基于全局和局部保持的半监督支持向量机

Weighted spherical 1-mean with phase shift and its application in electrocardiogram discord detectio

Knowledge-Leverage based fuzzy system and its modeling

Kernel density estimation, kernel methods, and fast learning in large datasets

基于模糊最大散度差判别准则的聚类方法

ML型迁移学习模糊系统

多核局部领域适应学习

极大熵Relief特征加权

大间隔最小压缩包含球学习机

基于ε-不敏感准则和结构风险的鲁棒径向基函数神经网络学习

局部保留最大信息差v-支持向量机

局部学习支持向量机

领域适应核支持向量机

隐私保护的SVM快速分类方法

总间隔模糊超球学习机

面向大规模数据的模糊支持向量数据描述

医学图像分割中基于数据浓缩的谱聚类算法

基于二面角平分插值的车身外形三维重建

改进的模糊C-均值聚类算法

基于有效神经元的自组织模糊神经网络算法

彩色图像迭代滤波算法

具有更好适应性的间距最大化特征加权

面向小目标图像的快速核密度估计图像阈值分割算法

物联网在教育中的应用与思考

基于模糊规则自适应弹性图像配准的视频跟踪

抗噪的有监督局部保留投影降维算法

基于相似性的中智学图像分割方法

基于最小包含球的大数据集域自适应快速算法

求解TSP问题的改进模拟退火遗传算法

基于能量分布的异构传感器网络分簇算法

The Maximum Vector-Angular Margin Classifier and its fast training on large datasets using a core ve

无标度网络中的边免疫策略

正交模糊k平面聚类算法

快速核密度估计定理和大规模图论松弛聚类方法

基于稀疏Parzen窗密度估计的快速自适应相似度聚类方法

适合大样本快速训练的最大夹角间隔核心集向量机

具有磁场效应的p-间隔核学习机

基于富人俱乐部特性的搜索免疫

求解VRPSDP问题的改进模拟退火遗传算法

最大边界模糊核超球分类方法

求解车辆路径问题的一种混合方法

具有磁场效应的大间隔支持向量机

支撑向量数据域描述优化问题最优解理论分析

L1范局部线性嵌入

最小学习机

多核局部领域适应学习

A minimax probabilistic approach to feature transformation for multi-class data

大间隔最小压缩包含球学习机

非线性分类的分割超平面快速集成方法

最大向量夹角间隔核分类

局部保留最大信息差v-支持向量机

模糊支持张量机图像分类算法及其应用

A kernel learning framework for domain adaptation learning

隐私团校准的模糊MEB学习

基于最大化密度差的L2核分类器

On minimum distribution discrepancy support vector machine for domain adaptation

领域适应核支持向量机

隐私保护的SVM快速分类方法

总间隔模糊超球学习机

基于相似性噪声检测的边缘保护滤波算法

医学图像分割中基于数据浓缩的谱聚类算法

基于有效神经元的自组织模糊神经网络算法

增量学习语义属性的图像内容检索系统增强

基于改进粒子群算法的云计算任务调度策略

基于属性约简和SVM参数优化的入侵检测方法

抗噪的有监督局部保留投影降维算法

基于相似性的中智学图像分割方法

半监督FSVM在羽绒菱节识别中的应用

基于最小包含球的大数据集域自适应快速算法

期刊信息

《计算机学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国计算机学会中国科学院计算技术研究所
主编：孙凝晖
地址：北京中关村科学院南路6号
邮编：100190
邮箱：cjc@ict.ac.cn
电话：010-62620695

国际标准刊号：ISSN：0254-4164
国内统一刊号：ISSN：11-1826/TP
邮发代号:2-833

获奖情况:
中国期刊方阵“双效”期刊

国内外数据库收录:
美国数学评论（网络版）,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:48433