东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

基于自适应加权的文本关联分类

ISSN号：1000-1220
期刊名称：《小型微型计算机系统》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]福州大学数学与计算机科学学院,福建福州350002, [2]复旦大学计算机与信息技术系,上海200433
相关基金：国家自然科学基金项目（60573076）资助;福建省自然科学基金项目（Z0515003）资助;福州大学科技发展基金项目（2004-XQ-17）资助.

关键词：数据挖掘, 关联分类, 规则加权, 样本加权, data mining, association classification, rule weighting, sample weighting

中文摘要：

在文本关联分类研究中，训练样本特征词的分布情况对分类结果影响很大．即使是同一种关联分类算法，在不同的样本集上使用，分类效果也可能明显不同．为此，本文利用加权方法改善文本关联分类器的稳定性，设计实现了基于规则加权的关联分类算法（WARC）和基于样本加权的关联分类算法（SWARC）．WARC算法通过规则自适应加权调整强弱不均的分类规则；SWARC算法则自适应地调整训练样本的权重，从根本上改善不同类别样本特征词分布不均的情况．实验结果表明，无论是WARC还是SWARC算法，经过权重调整后的文本分类质量明显提高，特别是SWARC算法分类质量的提高极为显著．

英文摘要：

In the research on text association classification,the quality of the classification result is influenced evidently by the distribution of feature words of training samples,the accuracy of classification will obviously fall when the distribution of feature words is uneven. In order to solve the problem,the association classification algorithms based on self-adaptive weighting WARC and SWARC are proposed,where WARC is the text association classification algorithm based on rule weighing,and SWARC is the association classification algorithm based on sample weighing. WARC algorithm adjusts the intensity of classification rules by rule weighting,and SWARC improves the distribution of feature words by the weight of training samples. Experiment result shows the accuracy of association classification algorithms can be obviously improved by self-adaptive weighting.

同期刊论文项目

　数字档案海量存储整体解决方案的研究

期刊论文 29

　文件档案中心建设对推动行政体制改革作用研究

期刊论文 29

多Agent系统联盟形成机制和算法的研究

期刊论文 32

同项目期刊论文

一种安全的多属性拍卖模型

基于势结构的任一时间联盟结构生成算法

最坏情况具有限界的联盟结构生成

基于局部最优的联盟结构生成算法

多Agent联盟结构动态生成算法

任一时间面向任务联盟结构生成算法

基于改进型蚁群算法的多任务联盟形成算法

一种基于按劳分配原则的联盟形成策略

基于遗传算法和 BP 算法的比较购物 Agent 模型

基于遗忘理论和效用的多Agent多问题协商

一种在Multi_Agent系统中协调形成策略的框架

基于蚁群算法的组合拍卖胜者决定问题求解

一种并发的双子集语义 Agent 模型

Agent意图的双子集语义改进模型

一种基于3APL的多agent合作系统

基于势结构的给定限界的联盟结构生成算法

一种新的支持向量回归机的模型选择方法

基于联盟组合的给定限界联盟结构生成算法

一种并发的双子集语义Agent模型

多Agent合作逻辑中的动作与意图

基于遗传算法和BP算法的比较购物Agent模型

一种安全的暗标叫价多属性拍卖方案

一种基于角色解决方案的多Agent合作问题求解模型

给定限界的势结构分组与联盟结构生成

交互时态信念逻辑及其模型检测

资源约束下基于离散粒子群算法求解多Agent资源结盟博弈问题

交互时态逻辑下的三种模糊信念算子

改进的多agent合作求解过程

一种挖掘模糊关联规则的新方法

基于神经网络的铜闪速熔炼过程工艺参数预测模型

轮轨接触状态可视化检测装置研究及试验

轮对外形轮廓检测中摄像机系统的标定算法

基于时间序列模式表示的异常检测算法

大屏幕FED视频显示系统

水平连铸QCr0.5铜合金线电磨损性能研究

辣木的特征特性及其栽培技术

冷变形Cu-0.36Cr（wt%）合金的抗软化性能和再结晶行为

瑞舒伐他汀对大鼠冠状动脉微栓塞后心肌局部炎症反应及左心室功能的影响

通心络对大鼠冠状动脉微栓塞后心肌间质重塑及左心室功能的影响

烟气制酸一级动力波入口压力控制系统建模

热处理对Cu-0．36wt%Cr合金组织和性能的影响

铜冶炼气流干燥过程的混合气专家系统设计

含不同Anti-Waxy基因拷贝数的稻米直链淀粉含量分析

转反义蜡质基因‘湘晴’及其杂交稻米的直链淀粉含量研究

柑橘天然生物活性物质吖啶酮的研究与利用

导入反义蜡质基因降低两系不育系稻米直链淀粉含量

籼稻9311成熟胚再生体系

构建社会主义和谐社会面临四大挑战

基于FPGA的大屏幕FED视频驱动控制系统的研制

摇椅弓角度和弧形深度对牙齿垂直向受力的影响

摇椅弓及牙列和牙周组织三维有限元模型的建立

思茅松树高曲线方程中的异方差研究

糯性小麦配粉对普通小麦淀粉品质特性和面条品质的影响

微量元素Cr、Zr对铜合金性能的影响

清热通淋胶囊治疗复发性尿路感染58例临床观察

重要籼型杂交稻亲本“93-11”稻米食味品质的改良