论文将强化学习算法应用于网络的拥塞控制中,该网络拥塞控制器可以调节源端发送数据的速率,使网络中可能发生拥塞的节点的缓冲区队列长度逼近给定值,从而避免了拥塞的发生,保证了网络的稳定运行。仿真实验验证了算法的有效性。