August 21, 2017

构建自己的AlphaGo

新的旅程

目的

我们的终极目标非常简单:那就是做一个自己的AlphaGo!

为了让我们的工作更简单些,我们把对弈的对象改成五子棋。由于五子棋的问题空间小上一些(五子棋棋盘15x15,围棋19x19),这可以让我们不用拥有DeepMind那么烧钱的硬件也能训练出能看的AI,同时也会出现一些领域相关的小细节和挑战。最后我们会去在线游戏平台上面看看它到底水准如何。

这篇半教程半工程日志的读者可以是没有任何机器学习基础的计算机学院学生(因为至少你得看得懂人话和Python代码,对吧?),我们会从最简单的井字棋游戏和深度优先搜索一直介绍到由卷积神经网络和蒙特卡罗搜索树构建的AI。半途中可能会有一些概......