位置:成果数据库 > 期刊 > 期刊详情页
基于多臂赌博机在线学习的频谱共享方法
  • ISSN号:1000-7024
  • 期刊名称:《计算机工程与设计》
  • 时间:0
  • 分类:TN92[电子电信—通信与信息系统;电子电信—信息与通信工程]
  • 作者机构:[1]西南科技大学信息工程学院特殊环境机器人技术四川省重点实验室,四川绵阳621010
  • 相关基金:国家自然科学基金项目(61379005);国防基础科研计划基金项目(B3120110005、B3120133002);西南科技大学博士基金项目(12zx7127)
中文摘要:

针对频谱共享中信道状态建模为完全知识马尔科夫时,应用受限的问题,提出了不同信道下基于信道感知的在线学习。根据授权用户是否存在于当前信道来选择激进发送或保守发送,由于保守发送时,信道状态是不可观测的,因此将信道模型建模为部分可观测马尔科夫决策过程。将信道未知情况下的最优传输策略建模为多臂赌博机模型。仿真结果表明,在信道不完全可知情况下的多臂赌博机在线学习算法能获得最优K步策略,并通过UCB-TUNED方法改善了最优传输的K步保守策略的收敛性。

英文摘要:

Aiming at the problems that when the spectrum sharing channel state was modeled as a complete knowledge of Mar-kov,the application was limited,different channel based on channel-aware online learning was proposed,and according to the presence or absence of authorized users,radical or conservative sending was chosen.Due to the unobservable conservative trans-mission channel state,the channel was modeled as partially observable Markov decision process (POMDP),and the optimal transmission was modeled as multi-armed bandit in unknown channel.Results of the simulation indicated that the multi-armed bandit online learning could get the K-conservative policy in the circumstances of not fully known channel.At the same time,the convergence speed was improved by UCB-TUNED algorithm.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机工程与设计》
  • 北大核心期刊(2011版)
  • 主管单位:中国航天科工集团
  • 主办单位:中国航天科工集团二院706所
  • 主编:汤铭瑞
  • 地址:北京142信箱37分箱
  • 邮编:100854
  • 邮箱:ced@china-ced.com
  • 电话:010-68389884
  • 国际标准刊号:ISSN:1000-7024
  • 国内统一刊号:ISSN:11-1775/TP
  • 邮发代号:82-425
  • 获奖情况:
  • 中国科学引文数据库来源期刊,中国学术期刊综合评价数据库来源期刊,中国科技论文统计与分析用期刊
  • 国内外数据库收录:
  • 波兰哥白尼索引,美国剑桥科学文摘,英国科学文摘数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:45616