位置:成果数据库 > 期刊 > 期刊详情页
一种基于位置的改进中文文本特征选择
  • ISSN号:0252-3116
  • 期刊名称:《图书情报工作》
  • 时间:0
  • 分类:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]解放军理工大学理学院,南京210007
  • 相关基金:本文系国家自然科学基金项目“基于不完全信息的交互式群决策理论及其应用”(项目编号:70571087)研究成果之一.
中文摘要:

通过引入位置因素修改TF—IDF因子进行初次特征选择,提出一种基于位置的文本特征加权改进模型;再借助类别信息构造类别向量提高文本类别表示能力,进一步提出一种位置加权模式下基于类别信息的文本特征加权改进模型。随后的文本分类试验表明,该加权模型相较于传统的TF—IDF方法,具有更好的文本分类效果。

英文摘要:

Firstly,the authors modify the TF-IDF with the position information to choose the primal feature set and put forward an improved weighting model based on the position. Secondly, by using the sort information to construct the sort vectors,the authors make the sort vectors have better ability of label. Lastly, the authors put forward an improved weighting model with the sort information, and have a test about text categorization and the result shows that this method is better than the traditional TF-IDF.

同期刊论文项目
期刊论文 77 会议论文 10 获奖 2 著作 1
同项目期刊论文
期刊信息
  • 《图书情报工作》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学院
  • 主办单位:中国科学院文献情报中心
  • 主编:初景利
  • 地址:北京中关村北四环西路33号
  • 邮编:100190
  • 邮箱:journal@mail.las.ac.cn
  • 电话:010-82623933 82626611-6614
  • 国际标准刊号:ISSN:0252-3116
  • 国内统一刊号:ISSN:11-1541/G2
  • 邮发代号:2-412
  • 获奖情况:
  • 多次荣获"全国图书馆学优秀期刊"、"全国优秀科技...,2005年,更荣获中国国家期刊奖二等奖,是本届唯一...
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:57601