CGF中的战场决策仿真十分复杂,要求CGF实体应能根据知识库做出类似人类的决策行为。目前,CGF系统中的决策模块大多是硬编码的,不能满足军用仿真发展的需求,这就要求CGF系统具有学习和自适应能力。Q-学习方法是一种特殊的增强学习方法,可以通过多次迭代计算正/负效益进行主动学习。本文介绍了Q-学习及其在CGF系统中的应用。这种较新的机器学习方法,在CGF中有着良好的应用前景。