基于核的增强学习与近似动态规划方法研究-东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：立项数据库 > 立项详情页

基于核的增强学习与近似动态规划方法研究

项目名称：基于核的增强学习与近似动态规划方法研究
项目类别：面上项目
批准号：60774076
申请代码：F030114
项目来源：国家自然科学基金
研究期限：2008-01-01-2010-12-31

项目负责人：徐昕
负责人职称：研究员
依托单位：中国人民解放军国防科学技术大学
批准年度：2007

中文摘要：

增强学习(reinforcement learning)是来源于人脑自评价(adaptive critic)学习机制的一类学习控制方法，在复杂系统的优化控制方面有广泛的应用前景,并且与运筹学的近似动态规划理论密切结合，近年来成为机器学习与智能系统的研究热点。本项目针对连续空间马氏决策过程的优化控制问题，以基于核的自适应评价增强学习与近似动态规划方法为主要研究内容，重点解决增强学习中实现连续状态与行为空间值函数逼近的核方法及其快速稀疏化算法；基于核的近似动态规划理论框架，包括基于核的启发式动态规划HDP、对偶启发式规划DHP等优化控制新方法；以及增强学习与近似动态规划中能够结合先验信息的核函数构造与模型选择理论与方法等。本项目的成果将能够有效解决现有理论方法面临的算法收敛性和提高泛化性能等挑战问题，推动增强学习与近似动态规划在实际大规模优化控制问题中的应用。

中文主题词：增强学习，核方法，学习控制，近似动态规划，Markov决策过程

成果综合统计

期刊论文
会议论文
专利
获奖
著作

16
12
0
0
1

Continuous-action reinforcement learning with fast policy search and adaptive basis function selecti

Sequential anomaly detection based on temporal-difference learning: principles, models and case Stud

Triple RRTs: an effective method for path planning in narrow passage.

面向资源分配问题的Q-CF 多智能体强化学习算法

协作多机器人系统研究进展综述

面向分布协同控制研究的仿真环境设计与实现

一种双轮驱动移动机器人的学习控制器设计方法

增强学习算法的性能测试与对比分析.

A novel multi-agent reinforcement learning approach for job scheduling in Grid Computing

支持向量机平凡解判别与修正的新方法

非结构化环境下自主车辆轨迹规划方法

增强学习算法的性能测试与对比分析

一种改进的RRT路径规划算法

双轮驱动移动机器人的学习控制器设计方法

采用核增强学习方法的多机器人编队控制

快速的三维人手运动跟踪方法研究

会议论文

Self-learning path-tracking control of autonomous vehicles using kernel-based approximate dynamic pr

Adaptive kernel-width selection for kernel-based least-squares policy iteration algorithm,

Path planning for redundant manipulator without explicit inverse kinematics solution.

Self-learning path-tracking control of autonomous vehicles using kernel-based approximate dynamic pr

Adaptive kernel-width selection for kernel-based least-squares policy iteration algorithm,

Path planning for redundant manipulator without explicit inverse kinematics solution.

Reinforcement learning control of a real mobile robot using approximate policy iteration.

A kernel-based reinforcement Learning approach to stochastic pole balancing control systems.

Reordering sparsification of kernel machines in approximate policy iteration.

An adaptive roadmap guided multi-RRTs strategy for single query path planning.

Adaptive dual heuristic programming based on delta-bar-delta learning rule.

无人车辆自学习控制的MDP模型与增强学习方法研究

著作

增强学习与近似动态规划

相关项目

面向计算生物学问题的小波构造理论的研究

期刊论文 10 会议论文 1

单类分类器和数据不平衡问题研究

期刊论文 38 会议论文 15

基于数据驱动的电力系统广域阻尼控制研究

期刊论文 17 会议论文 8 著作 1

半监督聚类及其应用研究

期刊论文 19 会议论文 10 获奖 1

基于投影向量机的动态协作过滤方法研究

期刊论文 12 会议论文 7 获奖 3

智能电网中大规模风电-水电最优动态互补协调机理

期刊论文 53 会议论文 8

结构化增强学习及其在虚拟人运动规划中的应用

期刊论文 16 会议论文 10

基于增强学习的多媒体传感器协作网络覆盖控制

期刊论文 30 会议论文 5 获奖 3

非可靠网络环境下的动态三维网格渐进压缩算法研究

期刊论文 33 会议论文 8 著作 4

徐昕的项目

基于学习的自主移动机器人运动规划与控制

智能汽车人机交互机理与人机共驾技术

期刊论文 1

基于增强学习的自适应入侵检测方法研究

期刊论文 26 会议论文 2 著作 1

结构化增强学习及其在虚拟人运动规划中的应用

期刊论文 16 会议论文 10