针对随机非线性动态系统, 探索新的最优控制途径, 建立基于性能势的最优控制基本框架, 进一步结合系统先验知识, 发展基于采样数据的在线优化算法, 并在一些标称系统上完成数值仿真. 具体内容包括: 在性能势理论框架下探索优化方程成立的一般性条件, 在此基础上设计反馈控制保证优化过程中闭环系统可以始终满足这一条件; 利用闭环系统采样序列对性能势和一步转移概率进行估算, 考虑利用系统先验知识对算法进行简化, 并通过函数逼近方法进一步减少计算量, 同时结合系统信息和优化方程特点讨论用于逼近的基函数集选择问题; 利用性能势和一步转移概率函数基于优化方程设计策略迭代算法逼近最优控制, 并通过采样数据对状态空间各离散化子集进行分析评估, 在相对重要的状态子集上优先进行迭代计算.