位置:成果数据库 > 期刊 > 期刊详情页
结合相关类别信息的大规模文本层次分类研究
  • ISSN号:1671-9352
  • 期刊名称:山东大学学报(理学版)
  • 时间:0
  • 页码:58-62
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]江西师范大学计算机信息工程学院,江西南昌330022
  • 相关基金:国家自然科学基金资助项目(60963014);江西省自然科学基金资助项目(2008GZS0052)
  • 相关项目:基于潜在语义对偶空间的跨语言信息检索理论和算法研究
中文摘要:

深层分类模型是一种解决大规模文本层次分类问题的有效范式。本文基于该范式提出一种改进型模型,首先将一种新方法用于单独评价搜索阶段的效果;然后利用类别和文档信息共同选择候选类别;最后基于类中心训练Rocchio分类器,同时利用相关类别的分类结果确定最终类别。在ODP数据集上的实验表明,相对于最新型的深层分类方法,该模型具有一定优势。

英文摘要:

The deep classification model is an effective paradigm for solving large-scale classification problems.An improved model was proposed based on the paradigm.First,a new method was used to evaluate the effectiveness of search stage independently.Second,the category and document information were collectively used to select category candidates.Finally,the classifier of Rocchio was trained based on the class centroid,and at the same time the information of related categories was used to determine the final category.Experiments on the corpus ODP show that the proposed approach outperforms the other new methods.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《山东大学学报:理学版》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国教育部
  • 主办单位:山东大学
  • 主编:刘建亚
  • 地址:济南市经十路17923号
  • 邮编:250061
  • 邮箱:xblxb@sdu.edu.cn
  • 电话:0531-88396917
  • 国际标准刊号:ISSN:1671-9352
  • 国内统一刊号:ISSN:37-1389/N
  • 邮发代号:24-222
  • 获奖情况:
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),波兰哥白尼索引,德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘
  • 被引量:6243