东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

覆盖算法下文本分类特征选择的研究

ISSN号：1005-3751
期刊名称：计算机技术与发展
时间：0
页码：29-31
语言：中文
分类：TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
作者机构：[1]安徽大学计算智能与信号处理教育部重点实验室,安徽合肥230039
相关基金：基金项目：国家自然科学基金（60675031）;“九七三”计划国家重点基础研究（2004CB318108,2007BC311003）
相关项目：基于商空间拓扑结构变换的动态信息分析

作者：王倩倩|张铃|张燕平|段震|

关键词：文本分类, x^2统计量, 覆盖算法, 特征选择, text classification, x^2 statistic, cover algorithm, feature selection

中文摘要：

文本分类是信息检索和数据挖掘的基础，被广泛应用于网络数据挖掘及搜索引擎等方面。首先对文本进行分词，对分词的结果分别使用x^2。统计量（CHI）方法与相关系数法（CC法）进行降维，并使用维数调节的思想进行特征提取。在得到特征集后，使用覆盖算法作为文本分类器进行学习。实验结果表明，通过结合相关系数法、覆盖算法以及维数调节方法，可实现一个效果较好的文本分类器。

英文摘要：

Text classification is the base of information retrieval and data mining and it is widely used in web data mining and search engine. Divides texts into words firstly and uses two methods named x^2 statistic and correlation coefficient to reduce dimensions, and then uses dimension regulation to obtain the feature. After getting the feature set, uses cover algorithm as a text classifier to study. The result of experiment indicates that it is an effective way to realize a text classifier with the combination of correlation coefficient, cover algorithm and dimension regulation.

同期刊论文项目

基于商空间拓扑结构变换的动态信息分析

期刊论文 76 会议论文 15 专利 4 著作 1

同项目期刊论文

基于免疫遗传算法的雷达重复频率选择

基于粒度计算的覆盖算法

改进的K-means算法在电信客户细分中的应用

A New Algorithm for Optimal Path Finding in Complex Networks Based on the Quotient Space

构造性覆盖方法的增量学习算法

一种粒度思想的遥感特征信息识别方法

商空间理论框架下的SVM产量预测模型研究

基于多侧面多分类器融合的月降水量预测

一种基于贪婪覆盖的文本分类方法

AN INFORMATION HIDING SCHEME BASED ON (7,4) HAMMING CODE ORIENTED WET PAPER CODES

应用Normal矩阵谱平分法的多社团发现

一种新的决策树选择性集成学习方法

一种新的网络拓扑建模方法

模糊核覆盖分类器及其应用

基于集成学习的规范化LDA人脸识别

合肥市降水变化趋势分形特征分析与预测

产业结构调整的量化分析

基于粒度计算的教学质量评价

局域世界删除演化网络模型

非线性动力系统R/S法的改进及小波预测

基于词共现模型的垃圾邮件过滤方法研究

基于覆盖算法的垃圾邮件过滤

基于构造性神经网络的时间序列混合预测模型

基于覆盖算法的大气质量预测

基于粗糙集理论的区域经济分析

不同粒度中的保序性

WCBVSM与SACA结合的文本分类模型

基于CHI值特征选取和覆盖的文本分类方法

基于覆盖算法的降雨量预测

粒度计算中的商结构

基于商空间理论的冬小麦产量预测和分析

灰色人工神经网络人口总量预测模型及应用

基于粗糙集的石油安全预警规则提取

基于商拓扑结构的序列构成和预测

一种新的属性约简算法

基于Rough Set的经济效益综合评价

一种基于聚类的交叉覆盖算法

粗糙集在经济分析中的应用

基于遗传算法的长频繁项集挖掘方法

一种基于模糊聚类的离散化方法

覆盖算法的概率模型

基于社团为粒度的网络分割方法

基于近似度的不完备信息系统属性约简

基于小波变换的气温趋势和分形特征分析

一种领域覆盖的数据流聚类算法

一种跳频信号动态检测方法

一种新的滑动窗口模型数据流聚类方法

基于满意度和GA的区间系数多目标规划求解

一种正交跳频信号动态分选方法

商拓扑结构变化的信息分析模型

基于灰色神经网络的粮食预测

基于数据流趋势分析的通信信号检测方法

结合粗集模糊熵和PCA载荷阵改进的TOPSIS方法

基于覆盖的多标记学习方法研究

应用改进混合高斯模型的运动目标检测

基于SVM的先分类再回归方法及其在产量预测中的应用

一种改进的电磁环境复杂度定量评估方法

基于覆盖算法的条件信息熵表示及属性约简

应用粗糙模糊度的不完备信息系统属性约简

非线性系统的全局有限时间内稳定

基于R／S方法的公司股票实证研究

基于小波变换的多重分形谱研究及实证分析

势关系下最优赋权的农产品PPI综合评价模型

基于交叉覆盖算法的蛋白质二级结构预测方法

基于模糊语言判断矩阵的多目标博弈研究

基于灰色粗糙集的能源消费量综合评价与分析

基于RoughSet的经济效益综合评价

区间数Fuzzy集的一种模式识别方法

一种基于最小差异度的关联分类方法

SVM在房地产需求量预测中的应用

基于模糊熵的城市设施水平综合评价分析

金融资本市场的多重分形谱研究及实证分析

基于粗糙度的一种分形维数计算方法