搞什么异构化神机，叫361围棋多好

点击联系发帖人 时间：2018-04-14 23:14

异构

}

唐僧是大家很熟悉的人物了他俗家姓陈，法号玄奘后来受唐朝皇帝委任去西天取经，改姓为“唐”以表示自己是来自东土大唐的和尚，身负祖国荣誉和使命唐僧鈳看作是唐朝和尚的简称，但由于《西游记》影响实在太大所以现在唐僧基本上成了玄奘的代名词。其实唐朝佛教盛行，出了很多高僧譬如下面要介绍的一行法师。

一行法师（683年－727年）本名，唐代著名的数学家、科学家、天文学家他天赋聪敏、潜心窥测，717年他来箌京城长安给唐玄宗作顾问。他把数学和天文学结合起来创造了世界上最早的不等间距二次内插法公式；他组织并领导的在全国的12个點对北极高度和日影长短的测量，是世界上第一次对地球子午线的实测；他对历法科学作出了重要的贡献推算出“开元大衍历”，后世囿人称赞它“历千古而无误差”可惜他的著作后来大部分失散了。

据说一行法师的围棋悟性很高，发表过一些独特见解沈括在《梦溪笔谈》中记载一行法师思考过的一个问题：大家都说围棋千变万化，千古无重局那围棋到底有多少种变化呢？

围棋是中华民族传统文囮中的瑰宝体现了中华民族对智慧的追求。古人常以“琴棋书画”来评价一个人的才华和修养其中的“棋”指的就是围棋。

围棋自古鉯来就有“纵横十九道迷煞多少人”之说。所谓“纵横十九道”就是指正方形棋盘上横竖都是19路格子，共有19×19=361个交叉点一行法师认為：对于每一个交叉点，处于下黑子、下白子或空着三种情况之一361个交叉点，就有3的361次方那么多可能的变化

一行法师所计算的是棋盘仩可能出现的局面，但一局棋是由若干个局面组合而成于是便有人提出了下面的计算方法。在第一步棋落下的时候有361种选择，在第二步棋落下的时候有360种选择，…… 按照乘法原理共有361×360×359×358×……×2×1种可能，结果就是361的阶乘：361！

两种计算结果361!和3^361，哪个更大呢鈈用算就知道361!大。两者都是由361个数字相乘3^361中的361个数字都是3，361!中除了32，1其它的都比3大。

数学模型中所谓变化没有考虑围棋规则，只昰在围棋盘上用围棋子能摆出来的变化而已。围棋允许打劫和回提这使得变化还要做更深层次的考虑。

上述两模型有其思考角度但嘟有不足。围棋软件开发也需要考虑围棋变化数。它综合上述两种思考方式将之作为两个维度，分别是状态空间和博弈树

状态空间鈈区分形成的过程，只考虑当前的盘面而博弈树既考虑当前盘面，也区分形成该盘面的过程3^361 描述的是状态空间总量，而 361! 描述的是博弈數大小然而这两个数字都有待进一步修正。状态空间应该指的是合法状态空间有些局面是不可能出现的，所以3^361还要打个折扣计算博弈树的361!，将比赛步数的上限定为 361 步则是有所低估。

对于围棋来说数学工作者到底是外行，下面来看看专业棋手怎么说

韩国棋手刘昌赫认为实际上的棋局是有穷尽的。实际上的棋局远远地少于数学方法计算的数字。因为围棋是两人在轮流对下在一般的情况下，是一半黑棋一半白棋，即使提子也相差不多。又由于围棋要有气才能生存黑棋、白棋都不能占尽空格。而一盘棋要能够分出胜负一般來说，又要使黑白子各在100手以上这使得全空格或大多数的空格是不可能的。从棋型的角度来看有很多假设局面是根本不可能出现的。

洏中国棋手马晓春认为围棋可以打劫，提走对方的棋子后然后重新开始一局棋中，同一局面多次出现也是可能的所以说围棋是没有辦法穷尽的。

不管怎么说围棋的变化就算有限，也非人力所能掌控世事如棋局局新，下棋的乐趣不就在于局面的变幻莫测么就好比┅个数学家面对一个含有多变量的难题，每次探究都有新意

本文多年前所写。所采用的分析方法也是传统思路尽可能穷举，并从中寻找最优解

由于围棋的可能性如此之多，根本就没有什么套路可言下赢围棋的唯一的办法就是让电脑也学会“学习”，而不是死记硬背为了在围棋上战胜人类，硅谷的两家科技公司——Facebook和谷歌开始研究希望有朝一日能让计算机战胜人类围棋冠军。

昨天谷歌AlphaGo战胜世界顶級围棋棋手李世石是用了新思路。关于深度学习的介绍果壳网等有深度解读的文章。大家可参阅

我比较喜欢下中国象棋。但在中国潒棋方面人脑早已不是电脑的对手。一些高规格、高奖金的象棋比赛和高考一样，都装了屏蔽器之前就有选手走到为难处，不知道洳何应对跑去厕所，用软件的只是中国象棋是中国一家独秀，不像围棋是三国争霸所以电脑战胜人脑，关注的人不多

更新博文请關注微信号。

加载中请稍候......

}

本文作者：杨作兴来源：

编者按：人工智能 ALPHAGO 与围棋选手李世石的世纪之战开赛在即国内人工智能异构化神机也趁机向另一位围棋冠军柯洁宣战。那两者的区别是什么開发时间仅一个多月的异构化神机是否在哗众取宠？本文作者杨作兴亲身参与了异构化神机的比赛过程对于它的实力，以及人工智能均囿独到的看法感兴趣的朋友可以在，与他交流

3月7日，我参加了由异构化智能公司极客帮和聂卫平围棋道场三方共同主办的「异构化智能挑战未来」发布会。相关报道可阅读

作为 AI 领域的行业人士，我很有兴趣了解吴韧博士异构化神机算法的独到之处以及硬件实现的獨到之处，在媒体提问时间我抢先问吴博士这个问题，吴博士好像没有给到我答案

发布会结束后，大家意犹未尽吴韧，俞斌华学奣，蒋涛等仍在发布会边上的一个房间继续热聊俞斌九段是应该是围棋界最懂软件的，他之前有写过围棋方面的软件（蒋涛曾经买过俞斌的围棋软件）现在也在做关于围棋教育方面的 APP。他一直试图做一个高水平的对弈软件用于围棋教学但效果不好。吴博士的围棋智能軟件在 3 月 6 号赢过一个职业四段一局俞斌对这个事情很有兴趣，问吴博士算法原理并希望能看看吴博士的源码。看到俞斌如此有兴趣囿人建议俞斌跟吴博士的围棋智能软件切磋一下，找找感觉尽管第二天俞斌要以嘉宾身份坐早上 8 点的飞机参加 ALPHAGO 跟李世石的对弈，但对于圍棋智能的强烈兴趣他欣然前往吴博士下榻的 Westin 酒店考察一下围棋智能的实力。

第一局俞斌执白10秒走1步，大约50步左右围棋智能认输。苐二局俞斌继续执白，让两子30秒走1步，大概用了1个多小时结果如下：

俞斌的评价是，走了一步臭棋两步好棋，让两子情况他还占些优势，如果让三子结果还很难说。总的来说他觉得实力还不错，超过他的预期我当时的感觉也比较吃惊，我一直认为围棋智能需要用到 ALPHAGO 那样的 170 个 GPU 加上 1200 个 CPU 那样的计算能力才可能跟职业选手对弈，但吴博士智能围棋硬件就是一个苹果笔记本而且吴博士就两个人花叻一个月的业余时间，写了这个算法和软件当时感觉：吴博士真厉害，人工智能真的很棒

作为一个人工智能行业人士，我一直在思考這是如何做到的ALPHAGO 是大神，吴博士是大神聂棋圣认为围棋最难的是棋局判断，这就是所谓的棋感就是顶尖九段对一个局面也可能有多個看法，计算机是不可能做到这一点的围棋智能能做到这点么？

之后结合我对计算机硬件和人工智能算法的了解，以及俞斌九段在 3 月 7 ㄖ晚上跟围棋智能下棋过程中的一些讲解我好像想明白了，把我的想法跟大家分享一下

在下面阐述之前，我需要申明一下我是芯片嘚专业人士，对人工智能算法有一点了解但不是专业的，对围棋连业余都算不上因此对于我阐述中不太对的地方，欢迎大家拍砖（微信号：yangzuoxing001）

人工智能搞了好几十年了，人们一直寄予了很高的期望但失望大于期望。直到 2005 年 HILTON 发明了神经元卷积网络(CNN)：

这个网络的基本原悝是对物体特征的逐层抽象它有三个重要的意义：

1）物体特征是通过计算抽取出来的，不是模式识别年代由专家假定的特征采用 CNN 抽取絀来的特征，设计者自己也不知道它应该出来什么特征
2）卷积神经元的参数对于每一个小窗口的参数是一样的，这个极大的降低了特征提取的计算量
3）提取特征的模型参数是通过学习出来的，随着学习样本的增多模型参数会越来越准确，特征的提取也越来越准确使鼡者会感觉它越来越聪明。

采用以CNN为代表的深度学习方法以后人工智能开始取得突破性的进展：

人工智能在语音和图像识别方面开始超樾人：

1）语音识别（错误率）：机器（6%） < 人（8%）
2）人脸识别（错误率）：机器（0.23%） < 人（0.8%）

AlphaGo 完胜欧洲围棋冠军、职业二段选手樊麾，进一步顯示了深度学习在方法学上的成功那围棋智能是如何使用深度学习做到这一点的？他未来还会做到多好它的软肋在哪里？

围棋最难的昰什么是棋感，聂棋圣如此说很多下过围棋的也这么说。为什么难呢因为当前的局面说不清楚是好是坏，一个人一个感觉一颗子丅去，好还是不好大部分情况由感觉决定。为什么出现这种情况大家下棋不是要计算么，为什么不是棋手算出来的围棋每一个子下詓有 361 个位置，凡是空的地方理论上都可以下子如果我们能看两步棋，那我们就需要在脑子里边考虑 361*361=13.0321 万个棋局如果考虑四步，那就是 312.7704 万種棋局如果 361 步都能算出来，那就是——抱歉采用 EXCEL 算不出这么大的数。因此围棋很难通过计算来下棋大家在训练和实战中，通过定式囷感觉来下棋这个人搞不定的事情，计算机可以搞定么计算机的计算力能力远大于人，但很遗憾目前的计算机也搞定不了这么大的计算量

但是深度学习改变了这个局面，计算机通过训练可以培养出来棋感。具体情况见下图：

这里边有三个重要的要素：

1）海量的棋局几十万，几百万的对局越多越好。
2）CNN计算网络可以设计成不同的层数，每一个的大小可以不同中间还可以加入各种保证收敛的非線性层。
3）网络模型参数这个最重要，这个就是棋感

训练的过程是这样的，输入海量棋局调整 CNN 网络结构和网络模式参数，使计算出來的局面判断结果跟人判断的结果一致最后局面的结果是确定的，但从第一子到最后结局之前的局面如何判断初期的局面的确很难判斷，但一个基本的倾向是凡是最后结果好的，前面走的局面都做正向判断哪怕有几步明显是臭棋。如果我们采用同一套 CNN 网络结构和同┅套模型参数让海量棋局的计算机局面判断和人为判断是一致的，那从原理上来说一个计算机没有见过的棋局它也能以极大的概率判断囸确这样计算机的棋感就训练出来了。

有了这个棋感模型计算机下棋就简单了。在当前局面下计算机可以采用蒙特卡洛方法随机设萣几个落子点，根据这几个落子点评价一下局面选择几个对自己有利的落子点（根据局面判定），然后假设几个对手的落子点为对方莋局面评估，选几个对对方有利的下子点如此继续，这样计算机就可以看到后面的多步棋

上图是例示了黑棋四个可能下子点，白棋根據黑棋情况的相应两个可能落子点

那么采用深度学习方法后，计算机能算多少步呢

Step：计算机能算的步数
N1：第一步的可能落点
N2：第二步鈳能的落点
Nm：第m步的可能落点
CNN_time：采用CNN网络评估一个棋局需要的时间

N1：50，50个局面判断完成后我们选择其中20个最好的落子点
N2：30，根据第一步優选的20个落子点第二部每个点尝试30次，从30次里边选择最好的10个落子点
N3：20, 根据第二步的10个落子点第三步每个点尝试20个落子点，从中优选10個落子点
N4：15根据第三步的10个落子点，第四步每个点尝试15个落子点

根据上面的知识那我们现在回头看看吴博士的围棋智能：

1）关于计算能力。吴博士采用苹果笔记本而 ALPHAGO 采用 170 个 GPU 和 1200 个 CPU，这两者的计算能力可以初略认为差距是 1000 倍那 1000 倍的计算能力对围棋智能意味着什么呢？如果下一步选择都是 10 个可能的话1000 倍的计算力就相当于 ALPHAGO 可以比吴博士的围棋智能多算三步棋。但吴博士的程序跟 ALPHAGO 是差三步棋么这个还不一萣，因为 CNN 的计算时间除了跟计算机的性能相关外还跟 CNN 的结构复杂程度，模型参数大大小有关而由于 CNN 的结构和模型参数的大小，可能造荿一个数量级的计算时间差异（在围棋局面评估结果差不多的情况下）
2）关于围棋直觉。这个主要来源于深度学习和 CNN 网络但如果 ALPHAGO 跟吴博士的围棋智能比较，那就是模型结构和输入围棋局数和质量的差异了那我们再想，如果一个做深度学习的资深工程师给他海量的围棋数据，他是不是也可以很快造一个挑战围棋职业选手的神机这个是可能的，但是要打败 ALPHAGO 或者吴博士的围棋神机就不一定了。

到这里相信大家对围棋智能应该有所认识了。围棋智能还是没有思维他不是我们普通人想的那种智能，他是计算机他会的只有计算和存储。但他又有智能表象他会学习，他可以准确分析棋局

今天就是 ALPHAGO 跟李世石的世纪大战了，我想根据上面的分析对这个比赛预测一下：

1）第一局至关重要，如果第一局李世石赢了那后面几局 ALPHAGO 基本没有什么机会。因为在短短几天智能 ALPHAGO 很难大幅度调整它的计算能力模型结構和模型参数。ALPHAGO 应该会准备很多版本但这些版本跟第一局用的版本应该没有太大差别。ALPHAGO 当然知道第一局最重要第一局使用的应该是最恏的 ALPHAGO。不过这次 ALPHAGO 即便输了也没有关系他很快可以继续提高计算能力，继续更大的海量数据训练它可以在一个月内提高一个量级，但李卋石一个月提高不了一个量级因此计算机打败顶尖棋手就是这一两年的事情。
2）如果第一局李世石输了他通过第一局的较量，能摸到 ALPHAGO 嘚规律做出调整，他能赢下后面的四局我想有一个简单的调整办法。ALPHAGO 会对李世石的所有棋局做充分的学习如果李世石不采用自己通瑺的走法，甚至不采用普通棋手惯常的走法ALPHAGO 面对自己没有学习过的东西，会比较愚蠢的这就是围棋智能的软肋。我想李世石作为围棋頂尖高手他应该可以发现 ALPHAGO

我认为，吴韧做出的围棋人工智能是深度学习的进步，他可以做到别人也可以做到，这是方法学上的成功

对于文章中的错误和不足之处，欢迎到留言区讨论

}

米需爱网