DeepMind联合创始人兼 CEO Demis Hassabis在赛后宣布,AlphaGo将永久退出竞技舞台,不再进行比赛。不过他表示:“我们计划在今年稍晚时候发布最后一篇学术论文,详细介绍我们在算法效率上所取得的一系列进展,以及应用在其他更全面领域中的可能性。我们希望更多的开发者能够接过接力棒,利用这些全新的进展开发出属于自己的强大围棋程序。”
10月19日,Hassabis兑现了他的承诺。DeepMind如约在《自然》杂志(Nature)上发表论文。在这篇名为《Mastering the game of Go without human knowledge》(《不使用人类知识掌握围棋》)的论文中,DeepMind展示了他们更强大的新版本围棋程序AlphaGo Zero,经过3天的自我学习,以100:0的比分完胜对阵李世石版AlphaGo。这验证了即使在像围棋这样最具挑战性的领域,人工智能也可以通过纯强化学习的方法自我完善达到目的。