位置:成果数据库 > 期刊 > 期刊详情页
面向聚类的堆叠降噪自动编码器的特征提取研究
  • ISSN号:1007-1423
  • 期刊名称:《现代计算机:上下旬》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:郑州轻工业学院计算机与通信工程学院,郑州450002
  • 相关基金:国家自然科学基金青年科学基金项目(No.61201447)
中文摘要:

为解决短文本聚类时文本的高维稀疏性问题.提出一种基于堆叠降噪自动编码器的短文本特征提取算法。该算法利用深度学习网络形式,把多个降噪自动编码器网络逐层堆叠起来,将高维、稀疏的短文本空间向量变换到新的低维、本质特征空间。实验结果表明,将提取的文本特征应用于短文本聚类,显著提高聚类的效果。

英文摘要:

The primary difficulty of text clustering lies in the multi-dimensional sparseness of texts. Proposes a short text clustering algorithm whmh based on the stack noise automatically reduction encoder. The proposed algorithm utilizes deep learning network form to stack up multinetwork of noise automatically reduction encoder step by step, and transforms the high dimensional and sparse short text space vector into a new low dimensional and essential feature s pace vector. The experimental results show that the extracted text characteristic is applied to short text clustering, which improves the clustering performance significantly.

同期刊论文项目
期刊论文 44 会议论文 6 获奖 8
同项目期刊论文
期刊信息
  • 《现代计算机:中旬刊》
  • 主管单位:中山大学
  • 主办单位:中大控股
  • 主编:林楚昭
  • 地址:广州市新港西路135号中山大学园东区106栋西座1楼
  • 邮编:510275
  • 邮箱:tougao@moderencomputer.cn
  • 电话:020-84110804
  • 国际标准刊号:ISSN:1007-1423
  • 国内统一刊号:ISSN:44-1415/TP
  • 邮发代号:46-205
  • 获奖情况:
  • 国内外数据库收录:
  • 被引量:1102