位置:成果数据库 > 期刊 > 期刊详情页
POMDP基于点的值迭代算法中一种信念选择方法
  • ISSN号:1673-0291
  • 期刊名称:《北京交通大学学报:自然科学版》
  • 时间:0
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]北京交通大学计算机与信息技术学院,北京100044
  • 相关基金:国家自然科学基金资助项目(90709006);国家“973”项目资助(2006CB504601);北京市科委重大计划项目资助(H020920010130);国家科技支撑计划项目资助(2007BA110B06-01);致谢:感谢Guy Shani教授提供的基于Java语言的POMDP软件,本文的实验是在其框架下完成的.
中文摘要:

部分可观察马尔可夫决策过程(POMDP)是描述不确定环境下进行决策的数学模型.基于点的值迭代算法是求解POMDP问题的一类近似解法.针对基于点的算法中信念选择这一关键问题,提出了一种基于熵的信念选择方法(EBBS).EBBS算法通过计算可以转移到的信念点的不确定性,选择熵较小且到当前信念点集距离大于一定阈值的信念点扩充信念点集合.实验结果表明,通过熵选择信念点的值迭代算法只需要在较少数量的信念点上进行值迭代操作就能得到预期的折扣报酬.

英文摘要:

Partially Observable Markov Decision Process (POMDP) provides a mathematical model for decision making under uncertainty. Point-Based value iteration algorithms are effective proximate algorithms to solve POMDP problems. In this paper we propose a belief selection method, Entropy-Based Belief Selection (EBBS), based on the entropy of belief points to the crucial issue of point-based algorithms. The EBBS algorithm first sorts the belief points by entropy and then selects belief that has lower entropy and whose distance to the current set is more than a threshold. And the experimental results illustrate that this method could perform value iteration operation on fewer belief points to gain an expected discounted reward.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《北京交通大学学报:自然科学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:北京交通大学
  • 主编:孙守光
  • 地址:北京市西直门外上园村3号北方交通大学8楼8101室
  • 邮编:100044
  • 邮箱:bfxb@bjtu.edu.cn
  • 电话:010-51688053
  • 国际标准刊号:ISSN:1673-0291
  • 国内统一刊号:ISSN:11-5258/U
  • 邮发代号:
  • 获奖情况:
  • 1995年铁道部科技期刊一等奖、1999年教育部组织的...
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:5152