位置:成果数据库 > 期刊 > 期刊详情页
优化策略模型下的匹配律算法
  • ISSN号:1001-0505
  • 期刊名称:《东南大学学报:自然科学版》
  • 时间:0
  • 分类:TP301.6[自动化与计算机技术—计算机系统结构;自动化与计算机技术—计算机科学与技术]
  • 作者机构:清华大学智能技术与系统国家重点实验室, 清华信息科学与技术国家实验室, 清华大学计算机科学与技术系
  • 相关基金:国家自然科学基金资助项目(60621062,60775040)
中文摘要:

利用基于部分可观马尔可夫决策过程的策略搜索模型,提出了一种具有优化行为的策略搜索算法,并推导出满足匹配律的策略算法.被试可通过调整策略参数,最大化目标值函数的期望值,并根据已往的经验调整策略参数.假定被试所处的环境具有马尔可夫性,通过计算值函数期望值的梯度可求得优化行为的策略搜索算法.理论分析与仿真结果表明,如果策略参数与值函数的期望值仅受当前经验的影响,则可由获得优化行为的策略算法推导出符合匹配律的策略算法.研究结果揭示了匹配行为与优化策略搜索算法之间的关系,表明满足匹配律的决策行为是一类达到次优的决策行为.

同期刊论文项目
期刊论文 61 会议论文 57 获奖 1 著作 1
同项目期刊论文
期刊信息
  • 《东南大学学报:自然科学版》
  • 中国科技核心期刊
  • 主管单位:教育部
  • 主办单位:东南大学
  • 主编:毛善锋
  • 地址:南京四牌楼2号
  • 邮编:210096
  • 邮箱:xuebao@seu.edu.cn
  • 电话:025-83794323
  • 国际标准刊号:ISSN:1001-0505
  • 国内统一刊号:ISSN:32-1178/N
  • 邮发代号:28-15
  • 获奖情况:
  • 先后荣获第三届国家期刊奖百种重点期刊奖,2006-2...,2013年荣获首届江苏省新闻出版政府奖"报刊奖"
  • 国内外数据库收录:
  • 美国化学文摘(网络版),美国数学评论(网络版),德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23651