在计算机视觉中,单纯数据驱动的统计机器学习方法过于依赖训练数据,对噪声较敏感且易出现过拟合现象,因此鲁棒性和泛化性不够理想。与此同时,在训练数据之外,大量领域先验知识却往往被忽略,未被加以利用。为此我们提出一种知识与数据混合驱动的概率图模型,将先验知识与训练数据相结合,使得两种信息相互补充,以获得良好的训练效果。在本项目中,我们将系统分析和辨识计算机视觉领域不同类型的先验知识,探寻具有较强适用性的知识抽象和表示方法,将先验知识转化为先验模型、约束条件和模拟数据三种形式,与训练数据相融合,作用于概率图模型的建立、学习和优化问题的求解,以期缩小优化问题的假设空间,提高学习的收敛速度,同时有效避免过拟合现象,减少模型对训练数据数量和质量上的依赖,提高鲁棒性和泛化性。我们将在人体行为分析问题中验证该方法的有效性,以及模型在不同训练数据条件下的鲁棒性和泛化性能。
英文主题词probabilistical graphical mode;prior knowledge;human activity analysis;;