传统的学习方法已经在众多智能系统中获得了广泛的应用。然而,传统方法实现的系统只能完成特定任务,且通过预先编程实现,面对更接近真实世界的非特定任务和不确定环境则无能为力,仅仅实现预先设定的、环境变化不大的低层次智能水平,和"像人一样的"完成任务这一目标还相距甚远。通过突破以往在智能研究上的思路,我们提出了具有认知发育机制的学习方法,该学习方法在马尔可夫决策过程下建模,使机器人通过增量的自主交互感知学习而不是人类预先编程建立认知映射,同时通过认知发育模型协调认知映射,并不断修正其模式和参数;通过TD学习更新当前状态对应的认知映射;在不确定环境下智能体利用自身认知发育机制完成特定和非特定的任务,从而实现高认知水平。利用上述研究理论,设计拥有自主知识产权的认知发育机器人软硬件系统,实现机器人模拟人的行为,如识别不同物体、完成自动寻找路径、从经验中学习解决更复杂问题的能力等功能。
cognitive development model;human brain inspired;online PCA;internal motivation;growing long-term memory
本研究项目的目标是研究新的认知发育学习方法,通过此学习方法实现智能体在不确定环境下利用自身认知发育机制积累经验,并从经验中不断学习,完成新的更复杂的任务,适应不断变化的复杂环境,从而实现更高层的认知能力。项目所做的研究工作主要有以下几个方面(1)提出一种仿人脑海马-前额叶回路工作记忆系统的认知计算模型,适用于机器人的认知主动学习新知识;(2)在该模型基础上提出了一系列主要的认知学习方法,包括用于底层视觉感知学习的基于自适应子空间的在线PCA算法以及RPCA算法,算法很好地实现了认知模型的视觉感知学习;针对奖惩机制的交互式认知学习问题,提出视觉陌生度驱动的增量自主式视觉学习算法,实现智能体主动探索新环境,学习新知识,并将新知识和经验积累至记忆系统;针对知识积累和发育问题,提出基于生长式长时记忆的认知发育学习方法,实现智能体交互学习的知识的积累和发育,并用于新任务。 项目研究要点与实现部分很好地完成了预期计划和要求,其中遇到的难点也将是后续进一步研究与探索的方向。