东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

iRIPPER——一种改进的基于规则学习的文本分类算法

ISSN号：1671-9352
期刊名称：《山东大学学报：理学版》
时间：0
分类：TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
作者机构：[1]中国人民大学信息学院,北京100872
相关基金：国家自然科学基金资助项目（60496325,60573092）

作者：袁晓航[1], 杜小勇[1]

关键词：文本分类, RIPPER, hRIPPER, 层次特征选择, 噪音特征项, 过滤, text categorization, RIPPER, hRIPPER, hierarchical feature selection, noisy feature set, filter

中文摘要：

基于规则学习的文本分类算法RIPPER具有易理解、易优化、高效率等特点，但是当规则所涉及的特征项很多的时候，上述优点不复存在。基于层次的规则学习算法hRIPPER采用了层次架构对RIPPER进行了改进，但其对特征项的过滤仍然有限。针对RIPPER，hRIPPER在规则学习过程中出现的问题，对规则学习的分类算法进行改进，提出了一种改进的基于规则学习的文本分类算法iRIPPER，在规则学习的同时进一步过滤噪音特征项。实验证明，该方法不但有效地提取了特征项，生成较少的规则，提高了算法的准确率和召回率，而且缩短了生成规则的时间，从而改进了规则学习分类算法的性能。

英文摘要：

The ntle-based text categorization algorithm RIPPER was specialized with easy understanding, quick optimization, and high efficiency. However, when the ntle refers to too many features, not only were the above advantages apparently weakened, but also the performance of the algorithm decreases. The hierarchy-based hRIPPER though uses hierarchical feature selection and can still not filter features fully. Then an improved text categorization algorithm iRIPPER was proposed to solve the problems in the learning process of RIPPER and hRIPPER, which filters features more thoroughly during the learning process. The experiment proves that it selects features effectively, generates fewer rules, and reduces the time in the growing process. Therefore it improves the performance of the ntle-based text categorization.

同期刊论文项目

因特网上非规范知识处理实验平台

期刊论文 57 著作 1

本体库管理系统技术研究

期刊论文 37 会议论文 37 著作 1

同项目期刊论文

领域本体进化研究

领域本体评价研究

Ontology Learning using WordNet Lexicon

关于知识组织体系的若干理论问题

学科领域本体的构建与进化

数字资源整合的发展趋势

一种面向高速度数据流的频繁模式挖掘算法

信息检索中基于词语-主题词相关度的语言模型

iRIPPER—一种改进的基于规则学习的文本分类算法

基于类别的推荐- - -一种解决协同推荐中冷启动问题的方法

一种能力属性增强的WEB服务信任评估模型

A Comprehensive Performance Evaluation of Buffer Replacement Strategies in RDBMS

知识网格研究

Graph-based query rewriting for knowledge sharing between peer ontologies

A Semantic Analysis of Chinese Radicals

A Review-based Reputation Evaluation Approach for Web services

Modeling Individual Cognitive Structure in Contextual Information Retrieval

基于WSMO的语义Web服务发现框架研究

Peer数据管理系统中视图维护策略研究

2DCMA: An Effective Maintenance Algorithm of Materialized Views in Peer Data Management Systems

Peer数据管理系统中的视图维护策略

知识检索研究

挖掘多关系关联规则

本体学习研究综述

E-Learning系统中课程知识本体的构建与实现

语义Web环境中本体库管理系统体系结构研究

语义Web数据管理研究进展

Prefetching J^＋-Tree： A Cache-Optimized Main Memory Database Index Structure

信息检索中一种基于词语-主题词相关度的语言模型

一种面向高速度数据流的频繁模式挖掘算法

一种能力属性增强的WEB服务信任评估模型

关联规则挖掘的取样误差量化模型和快速估计算法

数据库和信息检索技术的融合

SEEKER: 基于关键词的关系数据库信息检索

LinkNet:一种用于大规模P2P系统查找的新方法

纯Peer to Peer环境下有效的TOP-K查询

CLASCN: Candidate Network Selection Supporting Efficient Top-k Keyword Queries over Databases

Searching Databases with Keywords

DETECTOR:基于关系数据库通用的在线关键词查询系统

S-CBR: 基于数据库模式展现数据库关键词检索结果

基于分形技术的数据流突变检测算法

知识网格研究

A Review-based Reputation Evaluation Approach for Web services

基于WSMO的语义Web服务发现框架研究

2DCMA: An Effective Maintenance Algorithm of Materialized Views in Peer Data Management Systems

内存数据库在TPC-H负载下的处理器性能

Peer数据管理系统中的视图维护策略

一种支持多维数据范围查询的对等计算索引框架

挖掘多关系关联规则

本体学习研究综述

非结构化对等计算系统中多维范围搜索

LEO:基于序列化的XML文档高效查询处理方法

QoS-Aware Composite Services Retrieval

基于高维空间的在线高效子空间Skyline算法——CSky

语义Web环境中本体库管理系统体系结构研究

语义Web数据管理研究进展

Prefetching J^＋-Tree： A Cache-Optimized Main Memory Database Index Structure

Efficient Incremental Maintenance for Distributive and Non-Distributive Aggregate Functions

电子商务系统的性能评测与数据存取优化

动态Web技术架构及其性能分析

缓存敏感的封闭冰山立方体计算

面向不同数据分布的多维直方图算法COCA-Hist

基于动态校验码的敏感信息保护技术研究与实现

XML元素级检索的反馈算法

面向更新密集型应用的内存数据库高效检查点技术

支持What-if分析的OLAP系统研究

基于熵相关系数的关联性自动判别方法——COCA

S-CBR：基于数据库模式展现数据库关键词检索结果

Cache-Conscious Data Cube Computation on a Modern Processor

信息检索中一种基于词语-主题词相关度的语言模型

基于图形处理器的数据流快速聚类

CLASCN： Candidate Network Selection for Efficient Top-κ Keyword Queries over Databases

面向电信运营应用的数据库基准测试

基于滑动窗口的进化数据流聚类

P2P环境下基于Bayesian网络的多粒度信任模型

主存OLAP系统中what-if查询处理策略

期刊信息

《山东大学学报：理学版》
北大核心期刊（2011版）

主管单位:中华人民共和国教育部
主办单位:山东大学
主编：刘建亚
地址：济南市经十路17923号
邮编：250061
邮箱：xblxb@sdu.edu.cn
电话：0531-88396917

国际标准刊号：ISSN：1671-9352
国内统一刊号：ISSN：37-1389/N
邮发代号:24-222

获奖情况:

国内外数据库收录:
美国化学文摘（网络版）,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,中国中国科技核心期刊,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,英国英国皇家化学学会文摘

被引量:6243