位置:成果数据库 > 期刊 > 期刊详情页
一种基于聚类的文本迁移学习算法
  • 期刊名称:杜俊卫,李爱军. 一种基于聚类的文本迁移学习算法,计算机系统应用,2010.(12): 238-24
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]山西财经大学信息管理学院,山西太原030006
  • 相关基金:国家自然科学基金(60873100)
  • 相关项目:贝叶斯分类器与判别式学习方法研究
中文摘要:

当现有训练数据过期,而新数据又非常少时,运用迁移学习能够有效提高分类器性能。本文提出一种基于聚类的文本迁移学习算法,给出了算法的主要思想及实现步骤。然后,在中文文本语料库上进行了实验,并与非迁移学习算法进行了比较。实验证明该方法能有效提高分类器性能。

英文摘要:

Transfer learning can improve the performance of classifier effectively, when the training data are out of date, but the new data are very few. In this paper, we propose a transfer learning algorithm for text classification based on clustering. We describe the main idea and the step of the algorithm. Then have experiment on text corpus of Chinese, and compare the algorithm with transfer-unaware algorithm. The experiments demonstrate that this algorithm significantly outperforms the others.

同期刊论文项目
期刊论文 27 会议论文 6 著作 1
同项目期刊论文