位置:成果数据库 > 期刊 > 期刊详情页
结合改进非负矩阵分解的模糊网页文本分类算法
  • ISSN号:1000-582X
  • 期刊名称:《重庆大学学报:自然科学版》
  • 时间:0
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]安徽大学计算智能与信号处理教育部重点实验室,合肥230039
  • 相关基金:国家自然科学基金资助项目(71171184); 安徽省自然科学基金资助项目(090412054); 教育部高等学校博士学科点专项科研基金资助项目(200803580024); 安徽大学青年科学研究基金项目(3305044); 人才科研启动项目(2303224)
中文摘要:

通过构建向量空间模型可以获得表征网页数据的词文本权重矩阵,然而直接基于此高维矩阵进行分类学习效率较低,为此提出一种结合改进非负矩阵分解的模糊网页文本分类算法。首先,通过迭代的归一化压缩非负矩阵分解将高维的原数据映射到低维语义空间,以降低问题的复杂性。然后,将模糊逻辑引入分类模型,通过特征词与类别的模糊隶属度来生成文本的类别模糊集,以解决确定性矩阵难以判定语义模糊词所属类别的问题。实验结果表明,与其他方法相比,所提出的分类算法具有较高的分类准确度和较好的时间性能。

英文摘要:

An item-document weight matrix representing the web pages could be generated by constructing the vector space model. Since the efficiency of direct classification through the high-dimensional matrix is relatively low, a fuzzy webpage text classification algorithm combined with improved nonnegative matrix factorization (NMF) is presented. Firstly, the original high-dimensional data are mapped into the low- dimensional semantic space via an iterative normalized compression NMF(NCMF) to reduce the complexity of the problem. Secondly, in order to solve the problem of categorizing ambiguous words by using deterministic matrices, fuzzy logic is incorporated into the classification model, where the fuzzy

同期刊论文项目
期刊论文 16 会议论文 4
同项目期刊论文
期刊信息
  • 《重庆大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:国家教育部
  • 主办单位:重庆大学
  • 主编:王时龙
  • 地址:重庆市沙坪坝正街174号
  • 邮编:400044
  • 邮箱:cdxhz@equ.edu.cn
  • 电话:023-65102302
  • 国际标准刊号:ISSN:1000-582X
  • 国内统一刊号:ISSN:50-1044/N
  • 邮发代号:78-16
  • 获奖情况:
  • 中国高校精品科技期刊,重庆市一级期刊
  • 国内外数据库收录:
  • 美国化学文摘(网络版),波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:26478