东篱科研大数据发现系统（DRDS）

欢迎您！东篱公司退出

申报数据库
1. 申报指南
立项数据库
成果数据库
1. 期刊论文
2. 会议论文
3. 著作
4. 专利
项目获奖数据库

位置：成果数据库 > 期刊 > 期刊详情页

基于蚂蚁优化算法的分层强化学习

ISSN号：1001-3695
期刊名称：《计算机应用研究》
时间：0
分类：TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
作者机构：[1]太原科技大学电子信息工程学院,太原030000, [2]广东石油化工学院计算机科学与电子信息系,广东茂名525000
相关基金：国家自然科学基金资助项目（61272382）

作者：周晓柯[1], 孙志毅[1], 彭志平[2]

关键词：蚂蚁系统优化算法, 强化学习, OPTION, 瓶颈边, ant colony optimization, reinforcement learning, Option, bottleneck edges

中文摘要：

自主系统中，agent通过与环境交互来执行分配给他们的任务，采用分层强化学习技术有助于agent在大型、复杂的环境中提高学习效率。提出一种新方法，利用蚂蚁系统优化算法来识别分层边界发现子目标状态，蚂蚁遍历过程中留下信息素，利用信息素的变化率定义了粗糙度，用粗糙度界定子目标；agent使用发现的子目标创建抽象，能够更有效地探索。在出租车环境下验证算法的性能，实验结果表明该方法可以显著提高agent的学习效率。

英文摘要：

Agent interacts with the environment to perform their assigned tasks in autonomous systems.Using hierarchical rein-forcement learning technology helps the agent to improve learning efficiency in the large and complex environment.This paper put forward a new method to find subgoal.It used the rate of change of pheromone which ants leaved in ergodic process to define the roughness,and used the roughness to define the sub-goals.It used the found subgoals to create abstract agent in order to explore more effective.The experimental results show that this method can significantly improve the learning performance.Authentication algorithm in a taxi environmental performance,experimental results show that this method can significantly improve the learning efficiency of agent.

同期刊论文项目

云计算中虚拟机资源与应用系统参数的协同自适应配置研究

期刊论文 30

同项目期刊论文

一种新的无线传感器网络业务流预测方法

成本约束下的云计算能耗资源调度优化算法

基于CSP的能耗高效云计算资源调度模型与算法

Stochastic bounded consensus of second-order multi-agent systems in noisy environment

仿人机器人相似性运动轨迹跟踪控制研究

改进的FAST TCP系统的全局稳定性分析方法

基于对象的视频摘要算法的实现与加速

基于执行器能量消耗的并联机器人优化

基于物联网技术的石化厂区有毒气体泄漏在线监测系统

基于HOG与支持向量机的成熟苹果自动识别

一种基于增量式时间序列和最佳任务调度的Web 数据聚类算法

单件小批量生产模式下MRP的柔性化改进

基于小波神经网络的实际业务流预测方法

融入时间关联因子曲线拟合的交通流异常挖掘方法

基于级联过滤的多模型融合的推荐方法

一种基于萤火虫群的实际流量预测方法

基于人工免疫和FARIMA模型的流量预测方法研究

面向注塑车间的高效作业调度方法

同向抽运光纤拉曼放大器功率转换效率的理论分析

基于嵌入式与物联网技术的城市绿化在线监控系统

基于历史连接信息改进的单边加速FASTTCP算法

基于物联网技术的人体云健康监护及预警系统

基于遗传算法的云计算资源调度策略研究

采用阈下信道的两方口令认证密钥交换协议

云计算下基于启发式混合算法的工作流调度研究

喇曼散射的数值仿真及其应用探索

BOM到CBOM的映射技术及其应用研究

石化装置设备腐蚀预警模型的设计与实现

基于嵌入式技术的石化厂区职工健康安全预警系统

期刊信息

《计算机应用研究》
北大核心期刊（2011版）

主管单位:四川省科学技术厅
主办单位:四川省计算机研究院
主编：刘营
地址：成都市成科西路3号
邮编：610041
邮箱：arocmag@163.com
电话：028-85210177 85249567

国际标准刊号：ISSN：1001-3695
国内统一刊号：ISSN：51-1196/TP
邮发代号:62-68

获奖情况:
第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:60049