围棋新手渣求教这道野狐围棋网征子题下一步怎么走

点击联系发帖人 时间：2018-01-01 19:38

野狐围棋官方下载

7,180被浏览3,350,894分享邀请回答13K503 条评论分享收藏感谢收起cs.utoronto.ca/~ilya/pubs/2008/go_paper.pdf但是，通过使用深度神经网络，也就是多层的网络，AlphaGo v13 可以达到 55% 左右的预测正确率。这有两个原因：一，是概念层面的。举例，人在选点时，会考虑附近的双方棋子的"厚薄"，但"厚薄"是个高级概念，大致可以认为是棋块的"安定性"与"棋形"的结合。那么我们可以想象，如果第一层的规则，包括一部分专门负责"安定性"的规则，和一部分专门负责"棋形"的规则，再往上一层就可以通过加权考虑这两种规则的结果，得出类似"厚薄"的概念。然后再往上一层，就可以再运用之前得出的棋盘每个位置的"厚薄"情况，进行进一步的决策。深度神经网络的最有趣之处在于，并不需要特别告诉它存在这样的概念的层次，它会自动从数据中形成这样的层次。二，与棋盘和卷积神经网络的性质有关。第一层的规则，最好是局部的规则，因为这样的规则的泛化能力较高。譬如 AlphaGo v13 第一层使用的是 5x5 的局部，然后在第二层中再考虑 3x3 个 5x5 的局部，由于这些 5x5 的局部之间有重叠部分，就会形成一个 7x7 的局部。通过一层层往上加，最终可覆盖整个 19x19 的棋盘（如果你喜欢，可以继续往上加）。这符合我们的一种直觉：棋形会从里向外辐射一层层的影响，先看 5x5 ，然后看看周边的棋子就是 7x7 的情况，然后继续看下去。自然的问题是，如果这么说，是不是层越多就越好？从前大家认为不是，因为太多层后很难训练，有时在训练集上的准确度已经会变差。但是，如果仔细想想，这有点问题。我们不妨假设新加的一层就是一个不变变换，就是什么都不改变，就把上一层的输入做为输出。那么，此时的模型不会变好也不会变差。换而言之，增加层数，是永远不应该变差的！（这里的意思是，在训练集上的准确度不应该下降。在测试集上的准确度可能会由于过拟合而下降）这就是 ResNet 残差网络的思想：通过使用它，网络可以加到上千层也没有问题，几乎是一个免费的午餐：通过运用残差网络和少量 MCTS 模拟，策略网络的准确度可达 58% 以上：。这近乎于理论最高值了，因为人的走棋不完美，同样的局面可以有不同的走法。===============然而策略网络是有弱点的。我在此更具体地说明几种情况。第一，学习的棋谱数量有限，因此会有未见过的局面；同时，有时会知其然而不知其所以然，只学到了表面。这个问题很有趣，譬如，很多人发现 Zen6 （包括 DeepZenGo）有时会在征子上短路。下图是
07:43 日 EWZGDXFEZ 与 Zen19L 在 KGS 的对局，黑棋是 Zen19L，走出了惊世骇俗的一步 M4，并认为自己的胜率高达 70% 以上：结果被白棋直接在 N4 征死（同时胜率立刻掉到17%...）。这到底是为什么？我们可以打开 Zen6 的策略网络显示（Hotspots 菜单）：非常有趣。Zen6 认为白棋最可能的下一步是在 G2（概率大小是按红橙黄绿蓝紫排列，最不可能的是无色），而 N4 是它眼中白棋最不可能下的棋。它根本想不到白棋会走 N4。这个问题的成因是明显的：在人类高手的对弈中，很少出现一方对另一方进行征子，因为另一方会预先避免对方征子成功。而策略网络在学习中，却不可能看到如此高的概念，它只能看到，如果有一方走出看似可以被征的棋形，另一方不会去征，于是，它所学到的，就是大家都不会去征对方的子。著名的第 78 手与此也有类似的原因（区别是隐蔽得多）。同样，机器很难理解人为什么会"保留"，因为人"保留"的原因是另一个层次的（例如作为劫材）。当然，人的"保留"也不见得都对。解决这个现象，初级的办法是加入手动的处理，更好的办法是通过自我对弈学习更多的局面。AlphaGo 比其它各路狗强大的重要原因，在于经过了上亿盘的左右互搏学习，见过的局面太多了。第二，由于输入中缺乏对于多口气的精确区分（请思考大家为什么没有精确区分），可以说它不会精确数气，对于对杀和死活容易犯晕。这一般可以被蒙特卡洛树搜索纠正，但总会有纠正不了的情况。不过，虽然其它各路狗在此都经常会犯错，但 Master 却还没有被人抓到，有可能在于它已经学会有意避免这种局面，就像传说它会有意避免某些大型变化。第三，靠感觉是不会精确收官和打劫，因此许多狗的官子和打劫有缺陷（换而言之，人可以靠官子和打劫逆转）。不过目前看来 AlphaGo 的新版已经专门为此做过额外处理，不会让人抓到这么明显的漏洞。我的一个猜测是，新版 AlphaGo 可能也建立了一个以"赢的子数"作为目标的价值网络，并且在适当的时候会参考它的结果。许多人可能会很好奇，为什么各路狗都是用"胜率"而不是"赢的子数"作为目标。这是因为大家发现以"胜率"为标准，得到的胜率更高（这看似是废话，其实不是废话）。说到这个，我见过网上有人提为什么不在稳赢的时候改变贴目，尽量赢得更多一些，棋走得更好看；这个想法其实大家早就试过了，叫 Dynamic Komi 动态贴目，后果也是会稍微降低胜率。不过，电脑的保守，有时候可以被人类利用。譬如，在电脑的棋有潜在缺陷的时候，可以先故意不走，等到收官阶段，电脑认为必胜（并且退让了很多）的时候再走，让电脑措手不及。最近陈耀烨就通过类似的办法连赢了国产狗好几盘，而 DeepZenGo 也被某位棋手抓到了一个漏洞连赢了好几盘（而这两位狗对付其它职业棋手的胜率已经相当高了）。围棋确实很有趣。我相信人机对抗并没有结束，还会继续下去，因为双方都会不断进步。758141 条评论分享收藏感谢收起}

米需爱网