3月12日,人机大战第三场已经结束,世界围棋冠军李世石遭遇三连败,五番棋比赛中谷歌AlphaGo已赢得胜利,剩下的比赛中李世石只能寄希望“赢一局”了。东方宝表示,希望李世石找到技巧,扳回来一点。“不要一上来就纠缠边角攻防,而抽身大布局的把控!
Deepmind的最新论文公布了不靠人类棋谱完全自我学习的AlphaGo Zero,并公布了AlphaGo Zero的自战棋谱和与之前AlphaGo版本对局的棋谱(可在弈客app看到)。这些棋谱给人类哪些启示?
12月7日,DeepMind团队又在arXiv上扔了个重磅炸弹,新一代AlphaZero在用了强劲的计算资源(5000个一代TPU和64个二代TPU)之后,用不到24小时的时间自我对弈(tabula rasa,也叫白板)强化学习,接连击败了三个世界冠军级的程序(国际象棋、将棋、围