位置:成果数据库 > 期刊 > 期刊详情页
基于掩码匹配的免疫否定选择文本分类方法
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:G254.11[文化科学—图书馆学]
  • 作者机构:[1]湖南商学院信息学院管理科学研究所,长沙410205
  • 相关基金:教育部人文社会科学研究青年基金项目(12YJCZH233);湖南省科技计划重点项目(2011SK2017);湖南省科技计划一般项目(2011GK3175);湖南省哲学社会科学基金一般项目(11YBB25);湖南省教育厅科学研究一般项目(11C0740).
中文摘要:

文本分类是信息检索与数据挖掘领域的研究热点,近年来得到了广泛的关注和快速的发展。根据免疫否定选择原理,设计了基于掩码分段匹配的否定选择分类器,用于实现文本匹配选择分类,克服传统否定选择分类方法对大样本空间分类效果不好的缺点。给出了适用于免疫优化的分类规则编码及分类信息分的评价标准,避免了传统分类算法缺乏全局优化能力的缺点,提高了对样本的识别能力,同时提高了文本数据分类的精确度,采用统计显著性检验本文方法的有效性及优越性。

英文摘要:

In recent years, there have been extensive studies and rapid progress in automatic text categorization, which is one of the hotspots and key techniques in information retrieval and data mining field. Based on immune negative selection principle, a novel mask matching negative selection classifier was introduced to accomplish the text classification. Overcome the traditional negative selection method of classification not suitable for large sample space classification. In order to improve the accuracy of classification, a text rule coding was defined and a criterion of information grade was proposed to obtain the rules that are simple and easy to understand. This method full use of all kinds of excellent traits of immune optimum in data classification and has a better command of obtain the global optimum than traditional algorithm. The statistical significant testing illustrate that the immune classifier is an available and feasible way for text classification, improved the classification' s precision and validity.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778