尽管行为控制(Behabior control)结构体系在低速轮式机器人特别是火星探测机器人中得到了成功应用,在实践上证明了行为控制范式的可行性。但由于目前行为控制方法没有研究机器人动力学过程,并且只是自主机器人控制体系的指导性设计方法,缺乏理论分析与证明,从而限制了行为控制在中高速自主机器人中的应用。本课题在申请人已取得的行为动力学控制(Behavior dynamic control)研究成果基本上,提出了基于标准可加性模糊行为控制器的仿射性系统运动规划与控制问题,应用标准可加性模糊系统理论、凸组合理论、马尔可夫链蒙特卡洛粒子滤波(MCMC-FL)理论研究该类控制系统的稳定性、可达性、计算复杂性及基于凸组合行为协调的行为学习方法;并将理论成果应用于六轮独立驱动越野机器人实验研究当中,以阐明本课题研究思路与研究成果的有效性与可行性,为行为控制理论的形式化奠定基础。
lunar rover;motion planning;behavior control;SD*Lite;chain-vector calculus system
本课题主要应用标准可加模糊、马尔可夫链蒙特卡洛(CMCM)粒子优化理论,研究六轮独立驱动机器人运动规划与控制问题;以之为基础,研制了我国月面巡视器实时/超实时动力学解算、任务规划、就位探测规划三个子系统。首先提出链矢符号演算系统。通过链矢规范、属性量自然表示及链矢概念,使树链系统具有简单、一致的运动学及动力学演算,使符号运算的物理意义更清晰,适用于运动学与动力学的分析及自动建模。其次,建立了基于粘弹运动副及弹塑性轮土力学的巡视器数值动力学模型、基于拉格朗日的巡视器动力学模型、巡视器正逆运动学模型、桅杆正逆运动学模型、机械臂正逆运动学模型。以二维凸模糊集为基础提出自然障碍提取方法;以CSpice为基础开发了星历计算系统;以Coin3D系统为基础,建立了月面巡视器、标准网格及点云地形的计算几何分析与障碍检测系统;进一步,建立本课题的软件分析环境。在行为建模方面,以标准可加模糊控制理论为基础,建立了巡视器趋向目标行为、避障行为、趋向目标的避障行为模型、停泊探测行为模型、数传通信行为模型、测控通信行为模型、充电行为模型、太敏观测行为模型;该行为系统包含行为执行条件、行为过程、行为效应、行为评价准则,可以集成人的经验、进行稳定性分析及行为协调的最优性分析。在行为规划方面,提出了基于SD*的马尔可夫链蒙特卡洛粒子优化方法一方面,粒子定义为机器人一个时刻的状态,粒子传播过程是机器人运动的流态;另一方面,SD*在规划时,通过可视检测不仅完成优价代价的削减,而且突破三维26邻域或二维8邻域方向的限制,满足高精度方向约束的需求;SD*解空间通过多叉树表示,适应最优规划的需求。基于SD*马尔可夫链蒙特卡洛粒子的月面巡视器任务规划在满足测控、数传通信、巡视器机动性、月面可穿越性、机械及观测视场、能量平衡、行为过程等约束下,以时间/能量或综合指标为优化目标,规划巡视器由起点并经过站点序列至目标的行为序列。基于SD*马尔可夫链蒙特卡洛粒子的月面巡视器就位探测规划在满足机械臂性能、机械及视场干涉等约束下,以最少动作数为优化目标,规划巡视器停泊位置与航向、机械臂展开过程的行为序列。研究成果体现于巡视器动力学解算、任务规划、就位探测三个子系统。通过内外场实验及综合演练测试证明了本课题研究的正确性。为我国月面巡视探测工程提供了重要的理论与技术支持,达到了课题预定目标。