位置:成果数据库 > 期刊 > 期刊详情页
基于强化学习的多机器人编队导航
  • ISSN号:1008-0562
  • 期刊名称:《辽宁工程技术大学学报:自然科学版》
  • 时间:0
  • 分类:TP24[自动化与计算机技术—控制科学与工程;自动化与计算机技术—检测技术与自动化装置]
  • 作者机构:[1]哈尔滨工业大学,机器人研究所,黑龙江哈尔滨150001
  • 相关基金:教育部长江学者和创新团队发展计划基金资助项目(IRT0423)
中文摘要:

针对多机器人系统在未知环境编队导航过程中遇到较长障碍物时,顺时针绕障和逆时针绕障的不同选择会给导航效率带来很大影响的问题,提出了一种三层强化学习方法。由高层的基于“条件-行为对”的在线学习适应环境障碍物的动态变化,中层采用角色交叉包含式控制结构保持队形,底层采用离线式常规强化学习机制获得避碰规则。仿真实验结果表明,由于只在高层保持在线学习,使学习空间得以缩小,学习时间得以缩短。该方法为复杂环境下的多机器人编队导航提供了一种有效的自主学习策略。

英文摘要:

When multi-robot formation encounters long obstacles in unknown environment, the choice of clock-wise circumambulating or counter clock-wise circumambulating will greatly affect the efficiency of navigation. A kind of reinforcement learning with three levels is presented to solve this problem. The high level is based on be station-behavior pair to learn the circumambulating direction according to the dynamic variational obstacles. The middle level uses a Role-Cross-Subsumption control framework to keep the formation of the multi-robots. The lower level uses the off-line reinforcement learning. Simulation results show that the method can reduce the on-line learning space and speed up the learning rate.The method provides an effective autonomous learning strategy for multi-robot formation and navigation.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《辽宁工程技术大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:辽宁省教育厅
  • 主办单位:辽宁工程技术大学
  • 主编:邵良彬
  • 地址:辽宁阜新市辽宁工程技术大学北校区学报编辑部16信箱
  • 邮编:123000
  • 邮箱:xuebao999999@126.com
  • 电话:0418-3350453
  • 国际标准刊号:ISSN:1008-0562
  • 国内统一刊号:ISSN:21-1379/N
  • 邮发代号:
  • 获奖情况:
  • 全国中文核心期刊,辽宁省一级刊物
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:19090