半监督学习介于有监督学习和无监督学习之间,既充分利用了有标记数据的信息又考虑了所有数据集所隐含的结构信息,具有广泛的应用领域。基于图的半监督学习利用数据图来刻画数据间内在结构,能更适应数据的不同分布等特点,从而提高了半监督学习直接的应用价值和潜在的应用领域。本项目将从最优化理论与方法的角度,重点围绕半监督二类分类问题、半监督多类分类问题和半监督多标记分类问题,研究基于图的半监督学习的最优化模型和算法,给出其最优化理论框架。利用全局局部协同学习策略进一步提高泛化能力,利用主动学习改进未标记样本无法干预的问题以提高学习性能,并将它们应用到实际问题验证一系列模型的效果,最终为基于图的半监督学习的研究和应用提供理论、方法和技术支持。
英文主题词active learning;semi-supervised learning;information entropy;uncertainty;bulk