位置:成果数据库 > 期刊 > 期刊详情页
网页自动分类融合模型研究
  • ISSN号:1673-2286
  • 期刊名称:《数字图书馆论坛》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]中国科学技术信息研究所,北京100038
  • 相关基金:本课题获以下项目基金资助:国家自然科学基金(基金号:60805050);“十二五”国家科技支撑计划项目(项目编号:2011BAH10B05);中国科学技术信息研究所预研项目(项目编号:YY-2010023).
中文摘要:

为了提高网页自动分类的准确率,基于信息融合的模型理论,提出了一种通用的网页自动分类模型和融合算法。该模型根据完成功能的不同分为四个层次:信息抽取层、数据预处理层、特征层和决策层,其中特征层是针对网页上不同种类的媒体信息采用不同的分类方法进行分类,并将分类结果分别输入决策层和与该特征层算法相关的其他的特征层。决策层是处理特征层的分类结果,并推导出最终的网页分类融合结果,并将该模型和算法进行了实现。实验表明,文章提出的融合模型和算法可以有效地改进网页自动分类准确率。

英文摘要:

For higher text classification precision, a general feature layer fusion classification model and algorithm are proposed, based on model theory of information fusion, adopting multi-information of the network for different classification, text and image information are used in the paper. The model includes two layers mainly, one is feature layer, which deals with different Media information with different classification algorithm, and inputs the classification results into the higher layer fusion centre separately. The other is decision layer, which deals with the results from the feature layer, and concludes the final classification result. The experiment expresses the fusion model can improve the text classification precision effectively.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《数字图书馆论坛》
  • 中国科技核心期刊
  • 主管单位:科学技术部
  • 主办单位:中国科学技术信息研究所 北京万方数据股份有限公司
  • 主编:曾建勋
  • 地址:北京市海淀区复兴路15号
  • 邮编:100038
  • 邮箱:DLF@istic.ac.cn
  • 电话:010-58882324
  • 国际标准刊号:ISSN:1673-2286
  • 国内统一刊号:ISSN:11-5359/G2
  • 邮发代号:80-414
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:2693