自适应的调整云应用所占用的资源是一种有效的保障云应用性能的方法,但传统的决策方法面向基于服务的系统(Service-Based System,SBS)时会存在一些问题,例如基于应用系统性能模型的决策方法不能很好适应云环境下SBS的动态变化,基于智能优化算法的决策方法效率较低.该文提出了一种基于强化学习的SBS云应用自适应性能优化方法.在该方法中,该文建立了自适应基本要素之间相互关系的特征描述框架,利用高层次的系统行为指标(如响应时间、用户并发量、资源量等)来描述系统性能的优化目标等.为了应对云环境以及SBS的动态变化,该文的方法采用了无模型(model-free)的在线学习算法,当用户并发量发生变化导致系统的预期行为发生偏差时,该方法通过不断重复"执行-积累-学习-决策"的过程,可以不断的积累经验数据并优化决策结果.为了保证自适应优化的高效性,该文提出了一种引导算子,可以有效的缩小候选自适应动作的范围,提高算法的学习效率.该文实现了以一个SBS为例的原型框架,使用该框架的实验结果证明了该文提出方法的有效性.