位置:成果数据库 > 期刊 > 期刊详情页
优化的覆盖算法在文本挖掘中的应用研究
  • ISSN号:1009-3044
  • 期刊名称:《电脑知识与技术:学术交流》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]安徽大学管理学院
  • 相关基金:教育部人文社科基金项目“基于粒度计算理论的文本挖掘技术的研究”(项目编号:11YJA870032)的中期研究成果之一
中文摘要:

文章首先分析了覆盖算法中存在的两个主要缺点,即由于分类边界的粗糙而造成的测试样本拒识的概率较大以及当所得的覆盖存在交叉时,测试样本的类别确定问题,在此基础上应用基于商空间的粒度计算理论针对覆盖算法中的第二个缺点进行优化,即对覆盖算法中的由于覆盖交叉而误判的样本进行二次识别。通过减小识别样本的粒度,使覆盖粒度在由粗到细的变化过程中,实现对误判样本的渐进识别,在更小的空间上实现对误判样本的二次识别,从而提高了识别率。最后在已进行过预处理的中文文本数据库中使用优化后的覆盖算法,实验结果表明,优化后的方法减少了误判样本的数量,降低了识别样本时的出错率,有效地提高了分类的精度。

同期刊论文项目
同项目期刊论文
期刊信息
  • 《电脑知识与技术:学术交流》
  • 主管单位:安徽出版集团有限责任公司
  • 主办单位:时代出版传媒股份有限公司 中国计算机函授学院
  • 主编:
  • 地址:安徽合肥市濉溪路333号
  • 邮编:230041
  • 邮箱:xsjl@dnzs.net.cn
  • 电话:0551-65690964 65690963
  • 国际标准刊号:ISSN:1009-3044
  • 国内统一刊号:ISSN:34-1205/TP
  • 邮发代号:26-188
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:23925