东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于演化超网络的中文文本分类方法

ISSN号：1671-7775
期刊名称：江苏大学学报(自然科学版)
时间：2013.3
页码：196-201
分类：TP391.4[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]重庆邮电大学计算机科学与技术学院,重庆400065, [2]计算智能重庆市重点实验室,重庆400065
相关基金：国家自然科学基金资助项目（61075019）;教育部留学回国人员科研启动基金资助项目（教外司留[2010]1174号）;重庆市教育委员会科学技术研究项目（KJ110522）
相关项目：面向不平衡数据分类的演化硬件集成学习方法研究

关键词：文本分类, 中文信息处理, 智能系统, 模式识别, 演化超网络, text categorization, Chinese information processing, intelligent system, pattern recognition, evolutionary hypernetwork

中文摘要：

为了提高中文文本的分类效果，提出了一种基于演化超网络的中文文本分类方法．采用中国科学院计算技术研究所的汉语词法分析系统对中文文本进行分词，保留文本中的名词、动词和形容词作为特征；以χ2统计方法进行特征选择；利用布尔权重计算特征权值．经处理后的特征向量作为系统的训练集和测试集数据．运用超边替代策略训练超网络分类模型，并实现对测试集特征向量的分类．对不同阶数设定下的演化超网络模型进行了性能分析，并将其与传统的KNN和SVM算法进行了比较．结果表明，本方法对复旦大学语料和搜狐语料可获得87．2％和72．5％的宏识别率、86．9％和70．5％的宏召回率、87．0％和71．5％的宏F1，接近或优于KNN和SVM分类方法．所提出的方法是一种有效的中文文本分类手段．

英文摘要：

In order to improve the performance of Chinese text categorization, a Chinese text categorization method was proposed based on evolutionary hypernetwork. A Chinese Lexical Analysis System （ ICT- CLAS） was employed to take the words with parts of verb, noun and adjective as candidate features. The χ2-test method was used to realize feature selection, and the feature weight was calculated by Boolean weighting. The preprocessed data sets were divided into training set and testing set. A hyperedge replacement strategy was used to train hypernetwork classification model for classifying testing sets. The classification performances of the hypernetwork models with different orders were analyzed and compared with traditional KNN and SVM. The experimental results show that the proposed scheme can achieve 87.2% and 72.5% of macro precision, 86.9% and 70.5% of macro recall, 87.0% and 71.5% of macro FI for Fudan University corpus and Sohu corpus, respectively. As an efficient tool for Chinese text classification, the proposed scheme is close to or better than KNN and SVM classification methods.

同期刊论文项目

多粒度流形学习及其在视认知计算中的研究

期刊论文 58 会议论文 12

面向不平衡数据分类的演化硬件集成学习方法研究

期刊论文 17 会议论文 4 获奖 4

同项目期刊论文

基于无线传感器网络的车辆分型算法

基于演化硬件的道路限速标志识别方法

基于多粒度流形学习的无线传感器网络定位方法

结合稀疏编码和金字塔匹配的视频检索

一种用于视频修复的块匹配方法

局部模式纹理描述符在光照变化的人脸识别中的应用

人体行为分析方法的研究与仿真

无线传感器网络中基于拍卖博弈的数据包转发算法

基于子模式纹理分析的鲁棒人脸识别研究

WSNs中基于网络编码的低功耗数据重传策略

超网络道路限速标志识别

基于频率特征向量的系统调用入侵检测方法

一种应用于交通环境中的运动车辆跟踪方法

HSV颜色空间下用演化超网络识别道路限速标志的研究

结合最优类别信息离散的细粒度超网络微阵列数据分类

基于演化学习超网络的微阵列数据分类

用于微阵列数据癌症分类的演化硬件多分类器

博客网络的演化过程研究

基于局部-空间模型的视频摘要研究与设计

ZSP400目标代码优化算法的设计

An automatic method to determine the number of clusters using decision.theoretic rough set

A weakly supervised approach to Chinese sentiment classification using partitioned self.training

A New Rule Extracting Method with the Incremental Attributes

Human Action Recognition Using APJ3D and Random Forests

Cloud Model.based Outlier Detection Algorithm for Categorical Data

Semi.supervised Laplacian Eigenmaps on Grassmann Manifold

Inner Product Laplacian Embedding Based on Semidefinite Programming

演化超网络在多类型癌症分子分型中的应用

自适应逃逸动量粒子群算法的数据库多连接查询优化

用于癌症分子分型的虚拟可重构结构演化硬件

一种改进的基于物质扩散理论的Item-based协同过滤算法

基于S-MAC的能量均衡协议

人员疏散出口选择行为的演化博弈模型

LPSO-SVM道路限速标志识别

过滤特征基因选择及演化硬件急性白血病分型

基于分块投影和形态学处理的多车牌定位方法

基于0-1规划的异构传感器网络任务分配策略

针对Swarm模型突现行为的新的动力学指标研究

能量感知的WSN节点分类控制路由算法

一种应用于运动车辆检测的背景更新方法

基于近邻非负线性组合的高分辨率图像重建

真实感火焰模拟

基于最大粒的规则获取算法

Passenger Flow Prediction Based on Particle Filter Optimization

基于独立重建簇的WSNs层次路由协议研究

基于异构的无线传感器网络能量空洞缓解研究

基于演化博弈的社交网络模型演化研究

基于引力度扩展的重叠社区发现算法

WSN中基于簇首重构的层次路由协议设计

基于时间调度表的无线传感器网络MAC协议

Bagging选择性集成演化硬件DNA微阵列数据分类方法

基于智能移动终端触屏行为的情绪识别

HSV颜色空间下用演化超网络识别道路限速标志的研究

结合最优类别信息离散的细粒度超网络微阵列数据分类

Bagging选择性集成演化硬件DNA微阵列数据分类

Evolutionary hypernetworks with GPU computation for classification of DNA microarray data

基于视觉的缩微智能车车道检测与控制

MLHN: A Hypernetwork Model for Multi-Label Classification

基于演化学习超网络的微阵列数据分类

Virtual Reconfigurable Architecture for Evolving Combinational Logic Circuits

用于微阵列数据癌症分类的演化硬件多分类器

Ensemble Cost-sensitive Hypernetwork Models for Imbalanced Data Classification

Sub-image Method Based on LBP Preprocessing and Recursive Random Sampling for Face Recognition

基于演化超网络的DNA微阵列数据分类方法

演化超网络在多类型癌症分子分型中的应用

Bagging选择性集成演化硬件DNA微阵列数据分类方法

基于AdaBoost集成学习的演化硬件DNA微阵列数据分类

期刊信息

《江苏大学学报：自然科学版》
北大核心期刊（2011版）

主管单位:江苏省教育厅
主办单位:江苏大学
主编：袁寿其
地址：江苏省镇江梦溪园巷30号
邮编：212003
邮箱：xbbj@ujs.edu.cn
电话：0511-84446612

国际标准刊号：ISSN：1671-7775
国内统一刊号：ISSN：32-1668/N
邮发代号:28-83

获奖情况:
原“机械电子部优秀科技期刊二等奖,江苏省高校学报优秀期刊一等奖,江苏省优秀科技期刊奖,江苏省期刊方阵优秀期刊,华东地区优秀期刊

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,美国数学评论（网络版）,英国农业与生物科学研究中心文摘,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）

被引量:8727