位置:成果数据库 > 期刊 > 期刊详情页
基于论域划分的无监督文本特征选择方法
  • ISSN号:1671-1815
  • 期刊名称:科学技术与工程
  • 时间:2013.3.8
  • 页码:1836-1839
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]郑州轻工业学院计算机与通信工程学院,郑州450002
  • 相关基金:国家自然科学基金(61201447)、河南省基础与前沿技术研究计划项目(102300410266、122300410287)、郑州市科技计划项目(121PPTGG362-12)和郑州轻工业学院博士科研基金(2010BSJJ038)资助
  • 相关项目:云计算Hadoop框架中高效迭代机制的研究
中文摘要:

由于缺乏类信息,使得无监督文本特征选择问题一直未较好地加以解决。为此,对该问题进行了研究并提出了一个基于论域划分的无监督文本特征选择。该方法主要是把论域划分的思想引入到无监督文本特征选择之中,其首先使用一种新型无监督文档进行文本特征初选以过滤低频的噪声词,然后再使用所给的基于论域划分的属性约简进行文本特征优选。实验结果表明这个方法能够克服文本聚类时缺乏类的先验知识的不足,可以较好地解决无监督文本特征选择问题。

英文摘要:

Due to the lack of class labels, unsupervised text feature selection problem hasnt been resolved ef- fectively. Therefore, this problem was studied and an unsupervised text feature selection method based on domain division was proposed. This method mainly makes use of supervised text feature selection doing unsupervised text feature selection. Firstly those low-frequency noise words are flihered by using a new wnsupervised document to make the text characteristics primary election, and then employs a presented attribute reduction based on domain division for text feature optimization. The experimental results show that this method can overcome the clustering flaw which lacks of transcendent knowledge and solve unsut)ervised text feature selection nrob]em well.

同期刊论文项目
期刊论文 44 会议论文 6 获奖 8
同项目期刊论文
期刊信息
  • 《科学技术与工程》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国技术经济学会
  • 主编:明廷华
  • 地址:北京市学院南路86号
  • 邮编:100081
  • 邮箱:ste@periodicals.net.cn
  • 电话:010-62118920
  • 国际标准刊号:ISSN:1671-1815
  • 国内统一刊号:ISSN:11-4688/T
  • 邮发代号:2-734
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国科技核心期刊,中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:29478