拟将人工智能理论与混沌控制相结合,研究复杂、非线性机器人社会行为的演化规律。具体研究为在行为映射中考虑行为的倾向性,为个体机器人设计社会属性;为适应复杂变化的环境,满足机器人社会复杂协作的需要,基于最大化原理,对机器人的社会属性进行演化;利用人工势能场原理,动态组织机器人社会的信息网络,构筑机器人群的组织结构;针对机器人存在的目的是更好地为人类服务这一理念,制定正常社会秩序下机器人应该遵守的社会规则;为提高学习/进化的速度,采用小生境技术进行机器人群的协进化;将强化学习和混沌控制理论相结合,进行机器人社会行为的演化研究;利用测度熵的概念,将机器人社会行为的演化区分为有序运动、混沌运动,并建立混合预测模型。本课题的研究,将深化对机器人社会行为与智能的认识,达到对机器人社会行为预测、控制与干预的目的,建立起社会意义下多机器人系统的理论框架与模型,形成一套机器人社会行为演化规律的理论研究体系。
Robot Society;Social Behavior;Artificial Intelligence;Reinforcement Learning;Chaos Theory
本课题从实际组织与社会系统中抽象出机器人社会的体系结构,结合人工智能、混沌学理论、基于行为控制及强化学习理论来研究机器人社会行为的分析、设计与开发途径。取得的研究成果为(1)提出了一种基于神经网络的移动机器人路径规划强化学习初始化方法,通过Q值初始化能够将先验知识融入到学习系统中,对机器人初始阶段的学习进行优化,从而为机器人提供一个较好的学习基础。(2)针对机器人群体行为强化学习过程中,状态空间随机器人数量指数增加导致算法收敛速度慢的问题,提出了基于知识共享的顺序Q学习算法,使得机器人在相对较小的子空间进行学习,提高了机器人的学习效率。(3)受蜜蜂视觉导航行为的启发,提出了机器人视觉路标机制,利用环境中现有的显著特征,给出直线墙搭建任务的基于行为的控制器设计,通过群体搭建实验分析了不同个体数目对系统性能的影响。(4)研究基于信息素的群体搭建机制,以信息素使用频繁的白蚁为研究对象,通过研究白蚁构筑王族巢室的搭建过程,抽象并建立了基于智能体的环境动力学模型以及个体行为模型。(5)研究机器人群体行为的数学建模问题,将机器人学习获得的基本行为作为建模对象,利用分形建模思想建立机器人协作追捕行为的完整数学模型。通过对机器人群体行为进行建模,可以分析关键参数对系统行为的影响,通过数学分析获得系统的最优化参数选择,为机器人群体行为的设计与分析提供必要的理论依据。(6)采用动力系统理论分析机器人之间、机器人与环境之间的交互作用。根据吸引子的特征值对机器人群体行为进行定量地描述与分析,利用量化参数研究影响机器人交互作用的关键因素,加深对机器人交互作用机理的理解。 在研究过程中做了相应的扩展,使项目的执行更具完备性和延续性。在构筑机器人群体的组织结构时,主要根据社会性生物组织演化过程中社会行为的涌现特性,研究自然界中一些社会性行为的涌现机理,并将一些社会现象工程化,运用于机器人社会性行为的设计。机器人基本行为设计更多地采用强化学习的方法,通过学习为大量简单个体建立行为规则,以机器人基本行为作为建模对象,利用分形建模思想建立机器人系统行为的数学模型。