我们对几类实际网络化离散事件动态系统(NDEDS)策略优化问题的研究表明,虽然马氏决策过程、网络化控制、分布式优化在理论上有较完善的体系,在应用中却存在一些局限,其核心困难策略优化一般未综合考虑网络化通信的不确定性、大规模系统中决策的分布性和各子系统关联拓扑的可控性。因此即使求得策略也难以在大规模系统中实现,既无法保证在网络化环境中的性能,也无法利用信息获取与决策之间的耦合关系。本项目拟从新角度,即明确将信息获取与策略优化综合考虑,利用NDEDS由事件驱动的特点,结合基于仿真的优化方法与分布式优化理论,给出分布式事件驱动的大规模NDEDS策略优化的系统性方法。这种思路的优点是1)明确考虑信息与决策的网络化随机延迟与丢包对策略性能的影响,所得分布式事件驱动的策略可在工程上实现;2)策略的最优性在概率意义下可评价。本项目的成果可望推进对工程中大规模NDEDS策略优化问题的系统性解决。
Networked Discrete Event Dynamic Systems;Policy Optimization;Event-Based Optimization;Markov Decision Processes;Ordinal Optimization
本项目主要研究分布式事件驱动的大规模网络化离散事件动态系统策略优化。这类问题有着明确的工程应用背景,面临着信息获取与策略执行中的随机延时与丢包,网络化分布式决策约束,基于仿真的性能评价,指数爆炸的信息、状态、策略空间等困难。本项目综合运用马氏决策过程、网络化控制、分布式优化与控制中的理论与方法,充分利用网络化离散事件动态系统由事件驱动的特点,研究了三个主要内容大规模网络化离散事件动态系统的基于事件的策略优化理论、分布式近似策略优化方法、基于仿真的拓扑优化方法。主要研究了四类理论与方法基于事件的近似优化方法、网络化分布式马氏决策过程理论、具有描述复杂性约束的策略序优化、基于仿真的优化方法。将这些方法应用在网络化建筑能源、网络化疏散两个主要的应用领域,发表了包括12篇IEEE Transactions论文和1篇Automatica论文在内的18篇国际期刊论文和25篇国际会议论文。获得2015年IEEE Conference on Automation Science and Engineering最佳会议论文奖,2014年World Congress on Intelligent Control and Automation最佳供应链领域论文奖。