围棋之后，人工智能围棋大战胜负博弈的更高境界是什么，电脑游戏吗

点击联系发帖人 时间：2017-05-27 23:11

中国围棋人工智能

人工智能完胜职业围棋手电脑以后会超过人脑吗
14:15 &&&&
编辑：周啸哲 &&&&
国际顶尖期刊《自然》报道了谷歌研究者开发的新围棋AI。这款名为“阿尔法围棋”（AlphaGo）的人工智能，在分先的情况下以5∶0完胜欧洲冠
昨天（1月28日），一则与围棋相关的新闻引来轩然大波。国际顶尖期刊《自然》报道了谷歌研究者开发的新围棋AI。这款名为“阿尔法围棋”（AlphaGo）的人工智能，在分先的情况下以5∶0完胜欧洲冠军、职业围棋二段棋手樊麾。消息一出，无论是否棋界人士，朋友圈都被刷屏了。围棋，这座棋类运动最后的堡垒，真的就这样被人工智能攻陷了吗？一天过去，各路人士冷静下来后认为，现在还难下定论。谷歌宣布所研发软件已能战胜职业棋手就在谷歌（google）、脸书（facebook）宣布进军人工智能围棋时，几乎所有的人都还在怀疑此举的成功可能性，但没想到，昨天（1月28日）谷歌就通过《自然》杂志宣称已分先战胜了职业棋手。在本次公布的报道中，谷歌称其研发的“阿尔法围棋”（AlphaGo）在去年10月进行了与欧洲冠军、职业围棋二段棋手樊麾的五盘大战，并取得了5∶0的惊人战绩。这五盘棋的棋谱也同时公布于世。众所周知，人工智能在很多年前就已经能够战胜国际象棋、象棋职业棋手，但在围棋领域却发展不快。不久前，一些职业棋手仍认为人工智能要战胜职业顶尖围棋选手至少还需要50年，甚至有的人认为永无这种可能。近年来，人工智能围棋的研发在国际上颇受关注，各种软件不时问世，其中以韩、日水平最高，但仍难突破业余围棋水平，甚至难以达到业余高段水平，与职业棋手的差距似乎是跨不过去的鸿沟。基于这样的普遍认识，谷歌此次发声，毫无疑问如同往一泓静水中投入一块石子，无论是棋界还是人工智能研发界，都立即引起了轩然大波。棋手震惊了但判定软件围棋水平仍不足事实上，棋界得知此事比《自然》杂志公布略早一些。在27日夜至28日晨，棋手李颉所组建的微信群率先揭露此事，一时间，群里就沸腾了，“恐慌”一词是当时的主基调。随后，樊麾本人也在群里予以了确认。他说，因为与谷歌有保密协议，这件事他一直没对外说。这位中国职业二段棋手，远赴法国传播围棋近十年，被称为欧洲围棋教父。但客观而言，由于远离职业赛场，他现在的水平并不能完全代表职业水平。他说，这个软件确实很厉害，虽然招法不一定是最好的，但在局部计算方面从不犯错。软件水平到底如何，还得用棋谱说话。很快这些棋手们就冷静下来，在仔细研究了棋谱后，得出了各自的判断。以天才出名的李颉、孟泰龄先后“诊断”了棋谱，基本都认定这个软件确实已经达到了很高水平，但仍处于业余顶尖水平。这一说法，基本也得到了中、韩其他职业棋手的认同。我省年轻棋手，世界三冠王得主柯洁这两天正在丽水省亲，昨天（1月28日）凌晨他也通过微博发表了看法：震惊！虽说看棋谱感觉水平有限……专家说攻克围棋应该不难但人工智能无法像人脑一样思维昨天（1月28日），记者为此专门电话采访了浙江大学计算机学院教授蔡登，他在大规模数据搜索，尤其是机器机深度学习方向有多年研究。蔡登老师本身不会下围棋，他对此事的认识是并不感到太吃惊。他说，棋类运动毕竟是一种智力游戏，计算的深度、广度决定了棋艺水平的高低。相比较象棋而言，围棋的计算量更大，现在的计算机一旦采用了更好更快的计算方法，一定是能在围棋领域战胜人脑的。对专家的认识，中、韩棋手却并不认同。他们认为，谷歌的这个软件确实已经达到了以往人工智能从未到达的高度，这本身确实已经是一件很了不起的突破，但围棋的难在于其思维方式的模糊性，并非简单的计算。假如人工智能不能像人脑一样进行思维，估计是无法达到人脑的高度的。人工智能究竟能否像人脑一样思维呢？蔡登老师也说，他对此并不乐观，“目前计算机恐怕还不如一个三岁小儿的思维能力。”据称，谷歌已与韩国天王级棋手李世石约定于3月份进行一次五番棋挑战，获胜方能得到100万美元的奖励。棋界一致认为，这个软件是否真的强大，还得看它能否过了小李这一关。但目前令大家更觉得可怕的是，“阿尔法围棋”与樊麾之战已过去了三个月，等面对小李时，它是不是会变得更加厉害还未可知。柯洁甚至又拿此事开涮了一把小李，他说：“可怕的是这还不是完全体，它是可以学习进化的……这一次，谷歌悬赏一百万美元与李世石下，只能说李世石运气太好了。以现在这个计算机的实力战胜李世石的可能性不到5%……”人脑、电脑探索都有无限可能性最近一段时间，围棋新闻频频引起关注。除了柯洁一飞冲天之外，最让大家乐于交谈的，似乎都与脑的开发有关。首先，是业余高手鲍云的盲棋挑战世界吉尼斯纪录。在他之前，世界上从未有人完成过围棋盲下的事。鲍云自从尝试盲目下棋后，一直致力于人脑开发的工作，并悬赏征集对手。然后，就在他创下一对五盲棋世界吉尼斯纪录后，一线棋手孟泰龄应邀与他一起完成了一盘盲目下联棋的任务。其次，一位网名为“真疯叔叔”的棋迷，号称已经成功探索出了一套快速学围棋的方法，可以让一位从未接触围棋的人，在极短时间内达到业余初段水平。这两天，他正在绍兴接受“最强大脑”团队的挑战，要让这些“最强大脑”在6天内达到职业棋手让9子的水平，棋圣聂卫平也应邀进行监督，虽然他本人对此并不相信。然而，很多以前被认为不可能的事，如今正一一变成现实。无论如何，谷歌的软件已经确实地战胜了一位职业棋手。对脑力的开发，看来并不局限于是否人脑，而这种开发也很有可能是永无止境的，但不可否认每一次进步都是人类的进步。对围棋而言，这样的事总是好的。20年前，人工智能“更深的蓝”战胜了国际象棋世界冠军卡斯帕罗夫，套用一句那个年代的电视剧《射雕英雄传》主题曲的歌词送给棋迷：问世间是否此山最高，或者另有高处比天高？在世间自有山比此山更高，但爱心找不到比棋好
（原标题：人工智能战胜了职业围棋手世界冠军柯洁都被震惊了）
来源：钱江晚报 &&&&
需要登录后才能评论
浙ICP备号-2
2版权所有宁波纽米地传媒科技有限公司 2002－, all rights reserved青青子衿, 悠悠我心, 但为君故, 沉吟至今
电脑围棋软件与人工智能
　　围棋作为唯一的一种电脑下不赢人的大众棋类，是何原因导致？谷歌的AlphaGo能战胜世界超一流棋手吗？现代人工智能是怎么解决围棋软件庞大的数据处理量？本文将对电脑围棋软件和人工智能相关问题进行一番探讨和分析。　　围棋是一种策略性两人棋类游戏，有这悠久而古老的历史，中国古时称&弈&，西方名称&Go&。围棋起源于中国，春秋战国时代即有记载，隋唐时经朝鲜传入日本，中兴于日本，近现代之后开始在国际上逐渐普及，目前职业围棋水平最高的国家是中国和韩国。　　电脑围棋的发展历史　　电脑围棋是人工智能（AI）的一个领域，该领域致力于开发出可以下围棋的电脑程序。自古以来，棋类游戏一直被视为顶级人类智力试金石，人工智能（AI）挑战棋类大师的也被看做人工智能发展的里程碑。　　最早的电脑围棋程序是1968年Albert Lindsey Zobrist开发的，他引入了一个评估函数对棋局进行分析，来估算双方占空的大小，然而，在国际象棋里能够得心应手地杀败世界冠军，放在围棋里却行不通了，在相当长的一段时间里，业界的普遍观点是电脑围棋只能达到业余棋手的水准。　　然而，从2006年开始，随着蒙特卡洛树搜索和机器学习在围棋上的应用，电脑围棋水平有了突飞猛进的增长，棋力普遍提升到业余高段的水准。　　蒙特卡洛树搜索算法的出现，可以看作是人工智能取得突破性进展的标志：计算机的思考方式，已经有点接近人类的思维方式了。目前使用蒙特卡洛树搜索的围棋对弈软件有疯石围棋（CrazyStone）、银星围棋（SilverStar）、天顶围棋（ZEN）等电脑围棋程序都取得了不错的成绩。　　2011年8月欧洲围棋大会，电脑围棋软件ZEN在19路盘上让五子击败日本职业棋手林耕三六段。2012年3月，ZEN被让四子击败了日本超一流棋手武宫正树九段，这是围棋程序首次在让四子的情况下战胜第一流职业选手。2013年，CrazyStone被让四子击败日本石田芳夫九段，2014年，CrazyStone被让四子击败日本依田纪基九段。可见围棋软件进步迅速，至少比起十年前对弈水平已经提高一大截，受让四子优势明显。　　2015年10月，同样基于蒙特卡洛树搜索的Google旗下人工智能公司DeepMind开发的AlphaGo，在没有任何让子的情况下，以五战全胜的成绩击败了欧洲围棋冠军：职业围棋二段樊麾，这也是电脑围棋程序首次击败围棋职业棋手。AlphaGo的下一个考验是拥有14个世界冠军头衔的韩国棋手李世石九段，李世石将于2016年3月与AlphaGo进行五番棋对弈。　　何为&&　　或称计算机随机模拟方法，是一种基于&随机数&的计算方法，这一方法源于美国在一战中研制原子弹的&曼哈顿计划&。频率决定概率，围棋对弈软件将最常见的对弈定式及棋形输入其中，从而达到较短时间提高棋力的功效。用通俗的语言解释了这种算法：&简单来说，人脑下围棋靠的是逻辑思维，而蒙特卡洛算法就是一个抽样调查的方法。其实就是一个赌博概率式的方法，如果电脑下100盘棋，用这种下法赢了60盘，用另一种下法只赢了50盘，那么，它就会认定第一种下法，而淘汰另一种下法。&　　围棋的人工智能为什么那么难？　　在国际象棋界，计算机早已经战胜最顶尖棋手。1997年，IBM的&深蓝&电脑程序在正常时限的比赛中首次击败了当时排名世界第一的棋手卡斯帕罗夫。2006年，人类最后一次打败顶尖的国际象棋AI，众多国际象棋特级大师面对象棋软件一筹莫展，竟没有一次胜绩。　　然而，围棋一直被认为是人工智能领域里的非常困难的挑战。当如IBM深蓝那样的超级电脑，已经能够击败世界上最好的国际象棋棋手的同时；围棋软件却始终无法击败世界顶级围棋棋手。　　那么，为什么让电脑模拟出围棋的人工智能有那么难呢？　　1. 围棋的棋盘　　围棋的棋盘很大（19&19），因此通常被认为是难以编写围棋程序的一个重要原因。围棋棋盘上每一点，都有黑，白，空，三种情况，棋盘上共有19*19=361个点，每回合有250种可能，一盘棋可长达150回合。同时，围棋有3^361种局面，而可观测到的宇宙，原子数量才10^80，可能产生的局数呈指数级增长。　　相比之下中国象棋9*9，国际象棋8*8，平均每回合只有35种可能，一盘棋有80回合；因此国际象棋和中国象棋AI的算法可以枚举所有可能招法，但这种思路却无法应用在围棋上。　　2. 下棋的规则和估值函数　　国际象棋和中国象棋每个棋子的价值都有所不同，棋子的走动必须遵守一定的规则，例如国际象棋，开局的时候可以动8个兵（*2）和两个马（*2）共20种招法，虽然开局到中期招法会多一点，但是总数也就是几十种。中国象棋也是一样，开局5个兵+炮（12）+士相*2+马*4+车*2*3+将帅共28种，跟国际象棋差不多。但围棋的下子没有限制，开局有361种选择，所有着法都有可能。　　象棋游戏判断局面也简单，将军的加分，攻击强子加分，被将军或者有强子被攻击减分，控制范围大的加分，国际象棋里即将升变的兵加分，中国象棋里接近底线的兵减分，粗略一算就可以有个相对不错的判断。　　在下棋的过程中，象棋的棋子数逐渐减少，使游戏逐渐简化。但是，围棋却是棋子数逐渐增多，每下一子，都会使局势变得更复杂。　　在胜负方面，囯际象棋目标明确，只要杀死国王即可。　　因此，国际象棋和中国象棋都可以有一个较为简单的估值函数，使得高水平象棋AI的软件易于开发。　　反观围棋，却缺少这种简单的估值函数，围棋的每个棋子的价值都是可变的，没有王和帅这样的攻击目标，每颗棋子一会是棋筋，一会又是废子，电脑难以实现&估值&。　　在胜负方面，围棋的胜负不是要杀对方棋子，而是占更多的地，每一步有数百种以上的走法，算法的困难度明显要高得多。围棋中的厚势本身并没有目数，但可以直接围空或者通过攻击间接围空，而厚势本身的价值，电脑也不好判定。　　可见，电脑程序之所以能打败国象和象棋特级大师，依靠的是不知疲倦的高速检索能力，每一种开局、每一种防御在计算机强大的运算检索能力面前都不值一提。不过这种机械方法在围棋面前却失去了用武之地。　　电脑难以判断围棋形式，人类就可以轻松判定，虽然人类无法拥有大量数据分析，却有得天独厚的逻辑推理能力，从一手棋到后面十手，乃至几十手，都可以&算&出。在&蒙特卡洛算法&出来之前，一位智力正常的人学习下围棋，用不了几个月就可以击败现在所有的电脑围棋程序。　　围棋AI的未来　　目前围棋AI中成绩最好的是Google DeepMind开发的AlphaGo ，曾在2015年10月，在没有任何让子的情况下以5：0完胜职业围棋二段樊麾。这是人类历史上，围棋AI第一次在公平比赛中战胜职业选手。　　AlphaGo使用蒙特卡洛树搜索算法，借助值网络（value network）与策略网络（policy network）这两种深度神经网络，通过值网络来评估大量选点，并通过策略网络选择落点。AlphaGo最初通过模仿人类玩家，尝试匹配职业棋手的棋局，一旦它达到了一定的熟练程度，它开始和自己对弈大量棋局，使用强化学习进一步改善它。　　神经网络系统是以人类大脑为原型的信息处理模式，可以根据特定的输入产生特定输出，并实现图片识别、语音识别等功能。谷歌做了两个神经网络，一个神经网络用于动态评估&&计算对手下一步棋落子的各自可能性，依靠计算机远远超过棋手的计算能力，在某种程度上会占据一定优势。另一个神经网络用于静态评估&&评估棋局交战双方总体态势。　　此外，谷歌还输入了海量棋手对弈的棋谱，并让AlphaGo以棋谱的数据为基础进行了几千万局自我对局，充分丰富了数据库，并将预测对手下一步棋落子的准确率提升到57%。　　在下棋的过程中，辅以蒙特卡洛算法&&因为围棋的各个棋子很难用数值进行打分量化，也不存在精确描述棋局的&围棋定律&，使得计算机在静态评估方面，单纯的高计算能力未必会强于职业棋手&棋感&之类的抽象思维。通用性的围棋盘面静态评估函数曾经是围棋人工智能的瓶颈，在引入蒙特卡洛算法后则很大程度上解决了这个问题。蒙特卡洛算法构造了一个随机的过程，并对过程采用进行统计评估，从而得出一个最优的解法。　　简单地说，蒙特卡罗算法对计算进行了筛选，对数据库中低胜率的选择直接抛弃，放弃了穷举法中那些大量消耗计算资源，但却没有意义的计算。明确了计算的主攻方向，使其对具有高胜率的选择有更加精确的计算和分析。特别是在选择策略中加入更多和围棋相关的专业知识，使得基于蒙特卡洛树搜索的围棋弈棋系统水平拥有和职业棋手较量的能力。　　2016年3月，AlphaGo将挑战世界冠军李世石九段。或许这一战，能够展示出目前围棋AI到底发展到了什么程度。　　参考文献：
　　除非注明，文章均为原创，转载请以链接形式标明本文地址
　　本文地址：
.andrewsyb
　GOOGLE 的算法挺好的，人类未来在智能机器人，应该有更大的发展。　
.月光xia漫步
很喜欢你的文章，平常都是使用rss订阅，看到一周没有新文章，等到博客上发现原来是rss订阅没有显示想不到这次竟然是沙-发，/呲牙
行军之路，源远流长
.不会飞的猪猪爱读书
“go”表示“围棋”，源自围棋的日语“碁”的发音ご
你问我啊。？，？！！，？？。？？
赞助商广告
本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.人工智能博弈论文_百度文库
两大类热门资源免费畅读
续费一年阅读会员，立省24元！
人工智能博弈论文
上传于|0|0|文档简介
&&人工智能博弈论文
阅读已结束，如果下载本文需要使用5下载券
想免费下载本文？
定制HR最喜欢的简历
下载文档到电脑，查找使用更方便
还剩47页未读，继续阅读
定制HR最喜欢的简历
你可能喜欢人工智能与博弈论――从阿尔法围棋谈起
日10:00&&&来源：
原标题：人工智能与博弈论――从阿尔法围棋谈起
谷歌AlphaGo（阿尔法围棋）在与棋手李世的人机大战中，最终以4∶1赢得胜利。这一人类智慧和人工智能的对决在世界各地掀起了对人工智能空前的关注热潮。
AlphaGo是一款围棋人工智能程序，由谷歌Deep Mind团队开发。AlphaGo将几项技术很好地集成在了一起：通过深度学习技术学习了大量的已有围棋对局，接着应用强化学习通过与自己对弈获得了更多的棋局，然后用深度学习技术评估每一个格局的输赢率（即价值网络），最后通过蒙特卡洛树搜索决定最优落子。同时谷歌用超过1000个CPU和GPU进行并行学习和搜索。
在过去20多年中，人工智能在大众棋类领域与人类的较量一直存在。1997年，IBM公司研制的深蓝系统首次在正式比赛中战胜人类国际象棋世界冠军卡斯帕罗夫，成为人工智能发展史上的一个里程碑。然而，一直以来，围棋却是个例外，在这次AlphaGo取得突破性胜利之前，计算机围棋程序虽屡次向人类高手发出挑战，但其博弈水平远远低于人类，之前最好的围棋程序（同样基于蒙特卡洛树搜索）被认为达到了业余围棋五、六段的水平。
这其中的一个原因就是围棋的棋局难于估计，对局面的判断非常复杂。另外一个更主要的原因是围棋的棋盘上有361个点，其搜索的宽度和深度远远大于国际象棋，因此，求出围棋的均衡策略基本是不可能的。AlphaGo集成了深度学习、强化学习、蒙特卡洛树搜索，并取得了成功。
我们这里顺便说一说人工智能和人类在另一项棋类项目――德州扑克的较量。德州扑克于20世纪初开始于德克萨斯洛布斯镇，后来在全美大面积流行起来。德州扑克以其易学难精的特点，受到各国棋牌爱好者的青睐。世界德州扑克系列大赛（WSOP）是一个以无上限投注德州扑克为主要赛事的扑克大赛，自上世纪70年代登陆美国以来，比赛在赌城拉斯维加斯的各大赌场举行。其中，以冠军大赛的奖金额最高，参赛人数最多，比赛最为隆重，北美各地的体育电视频道都有实况转播。有史以来第一次人类和计算机无限注德州扑克比赛于日到5月8日在美国宾夕法尼亚匹兹堡的河边赌场举行，组织者为卡内基梅隆大学的Tuomas Sandholm教授，包括微软研究院等多家机构提供了奖金支持。该比赛共有两组玩家，一组是电脑程序“Clau-do”，另一组是该类扑克游戏的顶级专家Dong Kim、Jason Les、Bjorn Li和Doug Polk。Clau-do是之前Tartanian（2014美国人工智能大会电脑扑克大赛冠军所用的程序）的改进版本。该比赛一共进行了8万回合，最后扑克专家以微弱的优势获得了胜利，学术界认为Clau-do取得了很大的成功。
和AlphaGo不同的是，Clau-do的策略基于扑克博弈的近似均衡。围棋比赛本身是一种完全信息博弈，而扑克是不完全信息博弈（玩家不能观测到对手手中的牌），因此比完全信息博弈更难解决。Clau-do通过下面这三个步骤决定其策略。第一步：原始博弈被近似为更小的抽象博弈，保留了最初博弈的战略结构。第二步：计算出小的抽象博弈中的近似均衡。第三步：用逆映射程序的方法从抽象博弈的近似均衡建立一个原始博弈的策略。Clau-do的成功必须归功于算法博弈论最近几年的进展。在2015年年初《科学》杂志发布的一篇论文中，加拿大阿尔伯塔大学计算机科学教授Michael Bowling带领的研究小组介绍了求解有上限投注德州扑克博弈均衡的算法，基于该均衡策略的程序 Cepheus是接近完美的有上限投注德州扑克计算机玩家，以致于人类玩家终其一生也无法战胜它。这并不是说 Cepheus一局也不会输，但是从长期来看，结果只能是平手，或者计算机获胜。需要注意的是，有上限投注德州扑克博弈比无上限投注德州扑克博弈要容易求解。由于围棋和扑克在本质上都是博弈问题，我们这里谈谈博弈论以及作为求解扑克博弈的算法博弈论。1944年，John von Neumann与Oskar Morgenstern合著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成，因此他被称为“博弈论之父”。尽管历年来，博弈论与计算学科学不时有显著的重叠，但在早期，博弈论主要为经济学家所研究应用。事实上，博弈论现在也是微观经济学理论的主要分析框架。博弈论在经济教科书中的应用非常广泛。在经济科学领域，很多杰出的博弈理论家曾荣获诺贝尔奖，如2012年诺贝尔经济学奖得主罗斯和沙普利。
就在博弈论理论出现不久后，人工智能领域紧随其后得到开发。事实上，人工智能的开拓者如von Neumann 和Simon 在两个领域早期都有杰出贡献。博弈论和人工智能实际上都基于决策理论。例如，有一个著名观点把人工智能定义为“智能体的研究和构建”。从20世纪90年代中期到后期，博弈论成为计算机科学家的主要研究课题，所产生的研究领域融合计算和博弈理论模型，被称为算法博弈论。近几年来，算法博弈论发展尤为迅速，得到了包括哈佛大学、剑桥大学、耶鲁大学、卡内基梅隆大学、加州伯克利大学、斯坦福大学等世界各大著名研究机构的重点研究，该领域的会议如雨后春笋般出现，并与多智能系统研究融合，其普及程度已经在缓慢地追赶人工智能。算法博弈论的主要研究领域包括各种均衡的计算及复杂性问题、机制设计（包括在线拍卖、在线广告）、计算社会选择等，并在包括扑克等的很多领域得到应用。过去几年，算法博弈论在安全领域的资源分配及调度方面的理论――安全博弈论逐渐建立并且在若干领域得到成功应用。
与算法博弈论求解均衡策略或者近似均衡策略不同，基于学习以及蒙特卡洛树搜索的AlphaGo无法在理论上给出赢棋的概率。考虑到将博弈抽象的思想应用到扑克博弈上的成功，是否可能将围棋博弈抽象成小规模的博弈，求解（近似）均衡策略，并产生原始博弈问题的策略？即使这种策略不能有赢棋概率的保证，这些基于均衡产生的策略有可能对提高AlphaGo的性能提供帮助。从另外一个角度，深度学习技术是否会为求解大规模博弈问题提供帮助也值得探索。也许我们无法证明基于深度学习的策略能够形成某种均衡，但是可能会从实验模拟结果来说接近均衡策略。因此，AlphaGo的成功不仅会引爆人工智能研究的热潮，也会促进人工智能与算法博弈论的进一步交融与发展。
（作者单位：新加坡南洋理工大学计算机工程学院）
使用微信“扫一扫”功能添加“学习微平台”
(责编：沈王一、谢磊)
热点关键词
热门点击排行榜
12345678910}

米需爱网