东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

同顺序Flow-shop问题的一种遗传强化学习算法

ISSN号：1000-6788
期刊名称：《系统工程理论与实践》
时间：0
分类：TP391.9[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：[1]深圳大学管理学院,深圳518060, [2]北京航空航天大学经济管理学院,北京100083
相关基金：国家自然科学基金（70371005,70521001）,高等学校博士学科点专项科研基金（20020006-4）,新世纪优秀人才支持计划（NCET-04-0175）

关键词： FLOW-SHOP, 遗传算法, 强化学习, 自适应, flow-shop, genetic algorithm , reinforcement learning , self- adaptive

中文摘要：

针对Flow-shop排序问题的固有复杂性,设计了一种遗传强化学习算法.首先,引入状态变量和行动变量,把组合优化的排序问题转换成序贯决策问题加以解决;其次,设计了一个Q-学习算法和基于组合算子的遗传算法相集成,遗传算法利用染色体的优良模式及其适应值信息来指导智能体的学习过程,提高学习效率和效果,强化学习则对染色体进行局部优化进而改良遗传群体,二者有机结合共同解决Flow-shop排序问题;再次,提出了多种适应性策略,使算法关键参数能够周期性递变,以更好地在深度搜索和广度搜索之间均衡;最后,仿真优化实验结果验证了该算法的有效性.

英文摘要：

Considering the inherent complexity of Flow-shop scheduling problem, an algorithm named Genetic Reinforcement Learning, GRL, is designed to solve it. First, state variable and action variable are employed to transform the combinational-optimization scheduling problem into sequential-decision problem. Secondly, a Q-Learning algorithm is proposed to integrate with a Genetic Algorithm based on combined operators. The agent is supervised by chromosomes＇ good modes and their fitness information. As a result, the agent＇ s learning performance is improved. The genetic population is also meliorated by the local optimization of Reinforcement Learning to each chromosome. So GA and RL are integrated in GRL to solve the Flow-shop scheduling problem. Thirdly, several self-adaptive policies are introduced into GRL algorithm to make it balance in exploitation and exploration. Finally, the algorithm is validated by simulation experiments.

同期刊论文项目

基于行为的若干社会经济复杂系统建模与管理

期刊论文 243 会议论文 4 获奖 4

基于启发式递阶优化与仿真的多层生产计划综合集成方法研究

期刊论文 27

同项目期刊论文

邻近机场的客流竞争模型研究

Comparative studies on information feedback strategies in traffic networks with overlaping routes

Traffic flow model considering signal light influence and its numerical simulation

A cellular automaton model for studying the on-ramp control of highway

Dynamical evolution processes of traffic flow and travel cost in urban transportation networks

交通信息对交通行为的影响和信息发布策略研究的一个新模型

高速公路入匝控制的一个元胞自动机模型

Equity and efficiency analysis of pricing strategies in a bi-modal network with heterogeneous user g

供应链的信息增量与信息价值研究

基于顾客参与的定制满意度研究

时尚电子产品顾客满意度的动态特性

供应商共享POS信息时的信息挖掘策略与方法

过程控制图在股票收益波动分析中的应用研究

中国养老保险隐性债务未来规模的预测

一类购买力平价指数的改进及实证研究

我国网上银行风险管理机制研究

基于宏观经济环境的银行信用风险度量模型研究

运用累积和控制图模型对公司财务危机的动态预测

专家诠释ICP

公司多阶段财务危机动态预警研究

2008年中国宏观经济面对的挑战与对策

公司财务危机动态预测比较研究

论公允价值在寿险负债评估中的应用

STABILITY ANALYSIS FOR TRAFFIC FLOW WITH PERTURBATIONS

Modeling the evolutions of day-to-day route choice and year-to-year ATIS adoption with stochastic us

含重叠路段交通系统中信息反馈策略的比较研究

基于样条变换的PLS回归的非线性结构分析

基于元胞传输模型的实时交通信息设计

可变临界间隙条件下的加速车道车辆汇入模型

论西藏多层次综合交通枢纽体系建设

Macro modeling and analysis of traffic flow with road width

股指期货推出对股票市场质量的影响

股指期权对股指期货的促进作用:来自韩国的证据

多元线性回归的预测建模方法

我国经济学和管理学研究需要理性、规范和科学

复杂网络的时空建模法(英文)

组合出行方式下的混合均衡分配模型及求解算法

Modeling time-dependent travel choice problems in road networks with multiple user classes and multi

不完全市场期货定价模型

商品期货便利收益的期权定价及实证检验

Cone dominance and efficiency in DEA

One-step solution fabrication of magnetic chains consisting of jingle-bell-shaped cobalt mesospheres

供应链中的不确定性信息失真及其弱化策略

An improved two-lane traffic flow lattice model

监管宽容条件下的存款保险定价研究

控制管理机会主义的有效工具——可转换债券

金融风险分析的问题及新方法探讨

交通网络中用户均衡行为的效率损失上界

相关系数与连接函数

Copula及其在贷款风险管理中的应用

我国外部均衡调节中的估值效应分析

商业银行运用内部评级法构造风险管理体系的几点设想

扩大就业的部门优先选择研究

基于GARCH模型的风险价值蒙特卡罗模拟

中国投资行为研究

中美两国可比居民储蓄率的计量:1992—2001

边界Logistic违约率模型Bayes分析及实证研究

信用评级转移矩阵的动态预测模型分析

我国城镇居民消费结构的实证研究

关于中日经济规模的国际比较

一种改进的两车道交通流格子模型

需求信息共享供应链系统的稳定性分析

Support vector machine forecasting method improved by chaotic particle swarm optimization and its ap

基于Block-Bootstrap仿真技术的基金选股能力

中国高等教育财政投入与经济增长关系模型

股票收益率预测模型的比较

我国行业层次的TFP估计:1981—2000

保险负债的风险价值边际:评估方法及应用

坚持现行宏观经济政策

经济复苏之时艰

贸易保护主义再次抬头

忧患在于经济增长减缓

考虑住房因素的中国居民资产配置问题研究

基于因子分析方法的PPI波动率研究

Static floor field and exit choice for pedestrian evacuation in rooms with internal obstacles and mu

A modified floor field cellular automata model for pedestrian evacuation simulation

Braess's paradoxes in dynamic traffic assignment with simultaneous departure time and route choices

Multiclass multicriteria mixed equilibrium on networks and uniform link tolls for system optimum

基于ATIS的多用户多准则随机均衡交通配流演化模型

Modal split and commuting pattern on a bottleneck-constrained highway

Analysis of density wave in two-lane traffic

Locating the variable message signs by cell transmission model

Scaling laws of the network traffic flow

Multi-agent simulation on day-to-day route choice behavior

A multiclass, multicriteria logit-based traffic equilibrium assignment model under ATIS

A model for evaluation of transport policies in multimodal n etworks with r oad and p arking capacit

An empirical study on university campus parking problem.

回购条件下的图书批发企业优化定价策略

离散时间不完全市场下基于计价单位投资组合法的期货定价模型

中国居民跨期住房租赁-购置行为动态优化建模及分析

供应链信息管理研究现状及展望

供应链需求信息的信息增量与信息价值

Use of travel demand satisfaction to assess road network reliability

我国商品期货市场中“即日交易者”过度自信的实证检验

基于商业银行资本配置的存款保险定价方法研究

中国的最优化动态IS-LM模型构建与应用

未保险存款的利率对存款保险定价的影响

对中国存款保险基金规模的初步测算

Optimization of time-varying parking charges and parking supply in networks with multiple user class

边界Logistic违约率模型及实证研究

用Hedonic函数估计中国PC机价格指数

考虑信号灯影响的交通流模型与数值模拟

考虑前方多车辆速度差的优化速度模型

中国代际内与代际间贴现率的实验研究

主成分回归的建模策略研究

Gram-Schmidt回归及在刀具磨损预报中的应用

基于主基底分析的变量筛选

Competitive analysis of two special online device replacement problems

考虑风险规避和认知更新的日常择路行为演进

Equilibrium properties of the morning peak-period commuting in a many-to-one mass transit system

Modeling park-and-ride services in a multimodal transport network with elastic demand

ATIS作用下的混合交通行为网络与效率损失上界

基于元胞传输模型的可变信息标志选址问题研究

日常择路行为的多智能体模拟

道路收费和通行能力的联合最优控制理论模型

三种Copula-VaR计算方法与传统VaR方法的比较

由巴林银行倒闭谈商业银行操作风险管理

寿险公司分红保险负债估价的进一步研究

我国存款保险制度的建立与实施研究

银行债务的清偿结构与存款保险定价

ACD模型的发展以及在金融中的应用

控制流动性思路的内在约束

基于贝叶斯网络的二元语法中文分词模型

Job-shop排序问题的遗传强化学习算法

高新技术企业研发合作模式选择研究——基于北京市38家高新技术企业的实证分析

外资银行进入与中国商业银行特许权价值

中国价格竞争力变动趋势分析：基于单位劳动成本的实际有效汇率测算研究

Knight不确定条件下的模糊二叉树期权定价模型

金融风暴与救市机制

A car-following model with the anticipation effect of potential lane changing

国企衍生品投资亏损：解析及监管启示

中国木质家具出口总量与结构预测建模研究

人民币指数美式期货期权定价研究

基金系内部交叉补贴行为研究

城市公交系统内乘客出行动态均衡模型

ATIS环境下交通配流的动态演化模型

一种求解双目标flow shop排序问题的进化算法

一种函数型数据的聚类分析方法

供应链中信息共享综合效益的确定、分配及信息共享最优范围研究

融资工具选择和融资规模研究—异质信念视角

城市快速路系统的元胞自动机模型与分析

信号灯和公交车站对T形路口交通流的影响研究

一种考虑速度随机慢化概率动态演化的交通流元胞自动机模型

考虑实施过程的车辆换道模型及其应用

换道概率对交通系统动能的影响

一类流水车间批量流与混排序的集成优化

基于系统动力学的供应链稳定性研究

区域通行能力与出行时间可靠性综合仿真模型

航空货运中心物流系统建模及仿真研究

求解同时取货和送货车辆路径问题的改进遗传算法

基于PSO-H优化算法的单机E／T调度问题

一种两层生产计划问题建模及其遗传算法设计

基于重要抽样技术的稀有事件仿真方法

航空制造企业技改项目管理动态特性仿真研究

基于统一建模语言的作业排序系统模型库设计研究

基于协同进化粒子群的多层供应链协同优化

一种求解集成生产计划的混合协同进化算法

一类多层生产排序问题的建模与求解

多产品环境下的一种递阶生产计划系统

一种求解变速机调度问题的混合蚁群优化算法

作业车间排序重调度问题及其改进修复约束满足算法

基于系统动力学的供应链稳定性判据研究

时间序列判别分析技术和指数加权移动平均控制图模型在公司财务危机预警中的应用

大规模曲线的自动分类方法及其应用

弹性需求下路段通行能力的退化状态分析

基于模糊聚类的城际高铁旅客出行行为实证研究

一种求解Job Shop问题的合作型协

一种求解集成生产计划的混合协同

PSO-H优化算法及其在单机E/T调度

一类流水车间批量流与混排序的集

强化学习和仿真相结合的车间作业

混合递进多目标进化算法及其在fl

一种启发式算法求解批量计划和排

一种两层生产计划集成问题建模及

求解多层生产计划集成问题的一种

递进多目标遗传算法

基于Arena的车间作业排序问题建

带部分回溯的过滤束搜索算法及其

一种求解双目标job shop问题的混

一种求解job shop问题的混合多目

一种求解双目标flow shop排序问题的进化算法

一类流水车间批量流与混排序的集成优化

航空货运中心物流系统建模及仿真研究

求解同时取货和送货车辆路径问题的改进遗传算法

基于PSO-H优化算法的单机E／T调度问题

一种两层生产计划问题建模及其遗传算法设计

一种求解集成生产计划的混合协同进化算法

基于巡航控制的公交运输系统元胞自动机模型

考虑驾驶员行为变化的入口匝道通行能力模型

考虑控制策略的公交运输系统元胞自动机模型

基于旅客运输可达性的空间均衡模型

考虑地铁车内拥挤和早到与迟到惩罚的通勤者出发时间选择模型

机场客流增长和地区发展关系的协整分析

固定需求网络中多用户类随机均衡的效率损失

基于动态信息反馈的日常出行决策模拟研究

基于多目标遗传算法的枢纽航线网络的鲁棒优化方法

二元语法中文分词数据平滑算法性能研究

人工蚁群觅食行为建模、仿真和分析

基于计划行为理论的高速铁路乘坐意向研究

从基金经理频繁跳槽看我国开放式基金经理的管理技能

电子市场下供应链协调研究进展

泡沫随机临界时点超指数膨胀模型：中国股市泡沫的检测与识别

不完全市场下基于局部风险最小策略的股票期货定价研究

混合递进多目标进化算法及其在flow shop排序中的应用

基于控制权转移视角的股权结构与公司价值——来自并购中上市目标公司的证据

非线性回归的自动化建模过程

基于行为分析的道路通行能力中车道数因素研究

基于主基底分析的两阶段变量筛选方法

基于施密特过程的变量筛选及其在森林覆盖率分析中的应用

基于高维稀疏数据聚类的协同过滤推荐算法

我国铁路发展绩效与其他六国的比较

校内停车问题的实证研究

国际油价波动对中国宏观经济的影响：基于中国IGEM模型的经验研究

技术变化、要素替代和贸易对能源强度影响的实证研究

Lane changing analysis for two-lane traffic flow

基于概率分布的局内特殊优惠卡问题及其竞争分析

价格连续型局内设备赁购问题的竞争分析

复杂网络理论与城市交通系统复杂性问题的相关研究

Schmidt-logistical回归及在股票投资风格分析中的应用

三维立体数据表的动态趋势聚类研究——以中国现代服务业为实例

N中连续取k好可修系统的模糊可靠性

Effects of the number of on-ramps on the ring traffic flow

基于Gram-Schmidt过程的多项式回归建模方法

曲线分类建模方法及其在GDP预测中的应用

基于线性信念函数的二元价值容介态分析

基于Arena的车间作业排序问题建模方法及其仿真优化系统设计

一种求解job shop问题的混合多目标遗传算法

一种求解Job Shop问题的合作型协同进化算法

多目标物流配送优化问题建模及其遗传算法设计

基于效用和成本的顾客参与研究

中国非寿险市场承保周期的存在性研究

基于Squeezer算法的大规模矩阵聚类分析

一种函数型数据系统聚类分析方法应用

基于期望的重要抽样方法研究

一类多状态系统的可靠性计算

交叉熵算法在企业违约风险评估中的应用研究

A new car-following model with consideration of the traffic interruption probability

道路通行能力中车道数因素的数学分析

期刊信息

《系统工程理论与实践》
中国科技核心期刊

主管单位:中国科学技术协会
主办单位:中国系统工程学会
主编：汪寿阳
地址：北京市海淀区中关村东路55号
邮编：100190
邮箱：xtll@chinajournal.net.cn
电话：010-82541407

国际标准刊号：ISSN：1000-6788
国内统一刊号：ISSN：11-2267/N
邮发代号:2-305

获奖情况:
第三届中国出版政府奖提名奖

国内外数据库收录:
荷兰文摘与引文数据库,美国工程索引,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国国家哲学社会科学学术期刊数据库,中国北大核心期刊（2000版）

被引量:56095