位置:成果数据库 > 期刊 > 期刊详情页
基于矢量量化的强化学习及其在机器人行为学习中的应用
  • ISSN号:1002-0470
  • 期刊名称:《高技术通讯》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]沈阳工业大学信息科学与工程学院,沈阳110870, [2]东北大学信息科学与工程学院,沈阳110819
  • 相关基金:国家青年科学基金(60905054)资助项目.
中文摘要:

针对强化学习(RL)中状态空间过大所引起的学习时间过长或算法难于收敛等问题,提出了一种基于矢量量化(VQ)技术的表格型强化学习方法——VQRL方法,该方法用矢量量化器的码书矢量来逼近强化学习的状态空间,从而有效地解决了强化学习的状态空间分割问题,并提高了学习的收敛速度。同时根据等失真理论将一种失真敏感自组织特征映射(SOFM)神经网络用于矢量量化,以达到更好的强化学习状态空间泛化性能。将此方法应用于反应式移动机器人的行为学习的实验验证了此方法的有效性,实验表明,此方法能够较好地解决复杂未知环境的机器人导航问题。

英文摘要:

Considering that in the course of reinforcement learning ( RL), the too large state space causes the problems of long time learning and difficulty in the learning algorithm's convergence, the paper proposes the VQRL method, a Lookup- Table reinforcement learning method based on vector quantization (VQ). The proposed method utilizes the codebook of vector quantization to approximate the continuous state space of reinforcement learning, which solves the partition state space problem of RL and improves the speed of convergence effectively. And based on the equal distortion theory, it uses a distortion sensitive self-organizing feature map (SOFM) to quantize vectors. Therefore, the favorable generalization performance of state space can be obtained. The proposed method was used for learning the behavior of a reactive robot. The experiments showed the effectiveness of the presented algorithm. It can effectively solve the navigation problems under complicated unknown environments.

同期刊论文项目
期刊论文 17 会议论文 3 获奖 2
同项目期刊论文
期刊信息
  • 《高技术通讯》
  • 北大核心期刊(2011版)
  • 主管单位:中华人民共和国科学科技部
  • 主办单位:中国科学技术信息研究所
  • 主编:赵志耘
  • 地址:北京市三里河路54号
  • 邮编:100045
  • 邮箱:hitech@istic.ac.cn
  • 电话:010-68514060 68598272
  • 国际标准刊号:ISSN:1002-0470
  • 国内统一刊号:ISSN:11-2770/N
  • 邮发代号:82-516
  • 获奖情况:
  • 《中国科学引文数据》刊源,《中国科技论文统计与分析》刊源
  • 国内外数据库收录:
  • 美国化学文摘(网络版),荷兰文摘与引文数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),英国英国皇家化学学会文摘
  • 被引量:12178