围棋做为人工智能领域最后一个没有被攻克的二人棋类游戏,一直吸引了大量的研究工作。本项目力图在小棋格下构造一个实际可用的基于机器自动学习的围棋系统。 本项目由两个子系统组成。第一个子系统研究如何用人工神经网络自动学习围棋评价函数。其研究重点是降低学习误差。第二个子系统研究如何用搜索算法修复自动学习的评价函数的评价误差。质量控制是两个子系统间协同的关键问题。本项目力图在围棋这个局限的领域内寻找有效的质量控制手段,来构造基于机器学习的有实用价值的围棋系统。
Computer Go;Machine learning;Monte Carlo search;UCT;
项目围绕UCT算法在围棋死活题上的应用、概率图模型在计算机围棋研究中的应用以及机器学习算法三方面的内容展开研究和探讨,取得了以下进展1.UCT在围棋死活题上的应用方面,提出并实现了封闭边界围棋死活题的UCT求解算法,并对算法的求解效率进行了探究;2.概率图模型在计算机围棋研究中的应用方面,在全面掌握了TrueSkill模型的基础上,提出了基于TrueSkill的围棋专业棋手排名算法,并且根据围棋比赛的特点,提出了融合先后手优势的竞技水平估计算法;3.在机器学习算法方面,研究了与计算机围棋相关的机器学习算法在其他领域,特别是在自然语言处理方面的应用。项目发表论文12篇,其中SCI收录1篇,EI收录5篇,已培养硕士研究生3名,正在培养硕士研究生1名。