谷歌的 DeepMind 人工智能目前已经进化到第四代,名为 MuZero。最新的版本可以无需学习棋类等游戏规则便能掌握游戏。该技术能够应用于机器人技术、工业系统以及混乱的现实世界。
早在 2016 年,AlphaGo 先后击败围棋世界冠军李世石、柯洁,这仅仅是 DeepMind 人工智能的初代版本,需要事先输入大量人类对弈数据、规则数据进行训练,然后才可以进行实战。AlphaGo 是首个能够利用神经网络、树状搜索完全掌握围棋的人工智能。
此后于 2017 年推出的第二代 AlphaGo Zero,能够不借助人类对弈数据,仅仅事先输入规则便可自行训练,最终掌握围棋。
谷歌第三代的人工智能 AlphaZero,不仅可以自主学会围棋,也仅仅依靠事先了解规则,掌握了国际象棋、日本将棋。