位置:立项数据库 > 立项详情页
基于量子随机博弈论的三维未知环境下多机器人合作与竞争问题研究
  • 项目名称:基于量子随机博弈论的三维未知环境下多机器人合作与竞争问题研究
  • 项目类别:面上项目
  • 批准号:61075076
  • 申请代码:F030601
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2013-12-31
  • 项目负责人:蔡则苏
  • 负责人职称:副教授
  • 依托单位:哈尔滨工业大学
  • 批准年度:2010
中文摘要:

追逃问题本质上研究多机器人系统中机器人之间竞争与合作的典型平台。本项目将三维未知环境下多机器人追捕多猎物问题看成是有限理性的多局中人的随机博弈问题。首先对移动机器人的运动学、动力学等关键技术进行研究,并集成建立三维虚拟仿真平台。其次,利用隐式马尔科夫拓扑地图实现不同度量地图之间的拼接,研究多机器人系统中三维同时定位与地图创建和协作同时定位与地图创建技术,对未知环境进行探索,创建混合环境地图,搜索猎物。其次,在发现猎物后,采用量子拍卖和量子协作强化学习方法分配追捕任务,建立动态联盟并分配角色,将复杂的多局中人量子随机博弈问题分解成一系列易于解决的二局中人量子博弈问题。然后,根据追捕者角色,建立追捕者的策略集和猎物的策略集,根据各自的收益函数,选择最优均衡解。最后通过三维仿真平台和实际多机器人系统考察方法的实用性和有效性。该项目为多机器人系统的发展提供自主知识产权的相关技术,具有重要实际意义。

结论摘要:

多机器人追捕目标问题作为多机器人合作与竞争问题研究中的一类典型问题,它研究的是一群机器人如何通过合作去有效地捕获另一群逃跑的机器人。本文在国家自然科学基金项目“基于量子随机博弈论的三维未知环境下多机器人合作与竞争问题研究”(61075076)的资助下,对多机器人竞争与合作领域的追逃问题进行了系统深入的研究。主要包括如下几个方面第一,基于概率框架,研究了三维未知环境下多机器人协作SLAM和目标搜索问题。为了有效地规划路径并搜索目标,本文通过综合考虑混合地图中单个节点的相似度和不同节点间的空间关系,建立优化过程中的目标函数,利用隐马尔可夫模型提高节点识别的准确率,从而把不同局部地图的拼接问题简化为特征匹配问题。第二,针对追逃问题,通过机器人间的能力分类和新型量子拍卖机制来实现追捕任务的动态分配和动态组盟,实现了一种允许动态联盟的多机器人合作追捕多目标问题第三,首先提出一种量子强化学习算法,将追捕联盟中n个追捕者追捕m个猎物的学习问题转化成许多共享一个量子位纠缠对的两个局中人之间小范围的学习问题,进而分解成多个二人追逃量子随机博弈问题,同时提出基于快速推进的多机器人分层追捕算法,引入活跃区域机制,在任务分配阶段由主追捕机器人使用量子拍卖方法构造机器人追捕动态联盟,从而利用快速推进法实现对逃跑者的压迫。第四,通过分析多个带有自利因素的机器人在对一个猎物的追捕过程中的策略选择对最终结果的影响,对最终收益分配机制进行调整,让机器人从另一个角度衡量自身利益,从而带来多个可供选择的博弈策略,并引入量子最小化博弈的方法,将经典策略空间扩展到量子策略空间的范围,在保证机器人仍存在追求个人利益最大化的同时,消除随机性和盲目性,提高追捕的整体效益。第五,在有障碍物存在情况下,扩展了基于运动图方法,增加了多种机器人行为,实现基于行为的多机器人追捕。针对连续状态下机器人追捕问题,提出基于量子强化学习和遗传算法的模糊逻辑控制学习算法,利用量子强化学习获得先验经验,利用模糊逻辑实现对连续状态的覆盖,利用遗传算法实现对模糊逻辑控制器相关参数的调整优化。第六,搭建多机器人追捕实物平台和仿真实验平台完成关键技术的验证


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 28
  • 0
  • 0
  • 0
  • 0
相关项目
期刊论文 25 会议论文 27
期刊论文 16 会议论文 15 著作 2
期刊论文 16 著作 4
蔡则苏的项目