顶级围棋高手一般能推算出多少步能算出多少步之内的变化

点击联系发帖人 时间：2017-05-29 09:27

下围棋

顶尖的围棋选手有很多，但顶尖的围棋AI似乎只有一个|算法|枚举|AI_新浪科技_新浪网
& 滚动新闻 &&正文
顶尖的围棋选手有很多，但顶尖的围棋AI似乎只有一个
3月23日是首届世界围棋精英赛的最后一天，参赛的中日韩代表选手分别是芈昱廷、井山裕太和朴廷桓，三位选手轮番对局三天，除了彼此之间要分出高下，还要分别对战日本的围棋程序DeepZenGo。DeepZenGo的开发者加藤英树在去年12月接受韩国《东亚日报》采访时曾信心满满的说：明年3月进行的世界围棋精英赛，DeepZenGo有信心击败中韩日三国的最强棋手。然而面对三位顶尖选手，DeepZenGo最后的成绩是两败一胜，前两局被芈昱廷和朴廷桓绞杀，最后一回合执黑中盘胜井山裕太，扳回一局。这次比赛虽有赢面，但是前有Master横扫个中高手的范例，DeepZenGo胜1输2的表现并不太出色。DeepZenGo对战中国选手芈昱廷虽然此前有AlphaGo战胜李世石的先例，但AlphaGo并不能代表围棋AI的普遍水平，DeepZenGo的开发者加藤英树在前两轮输赛后都表示特别遗憾，但是其实结果并没有出乎大家的意料——19日在东京落幕的第十届UEC杯世界计算机围棋赛中，DeepZenGo就不敌腾讯研发的“绝艺”，曾经称霸UEC的黑马这次错失了冠军。去年3月，来自DeepMind的AlphaGo以4:1的成绩战胜韩国围棋九段李世石，这是人工智能首次在围棋领域战胜人类高手，引起世界范围空前的关注。但在这之前，机器在围棋领域的学习已经超过十年，从2007年第一届UEC杯开始，研发团队就不断发掘计算机程序在围棋项目上的潜力了，DeepZenGo的前身Zen就是这其中一个。2006年日本游戏工程师尾岛阳儿开始研究围棋算法，写出了最原始的Zen。到了2009年，蒙特卡洛算法（Monte Carlo method）开始大面积引入围棋程式，成为了机器下棋的主流算法，也帮助Zen拿到了第一个国际大赛冠军。棋类游戏有一种最原始的算法叫穷举法，穷尽所有可能进行枚举——在下棋的时候把所有会出现的情况全部过一遍，总能找到一个最优的解法，不管是对五子棋，还是象棋或国际象棋。穷举法给计算机带来的优势都很明显，早在1997年IBM的“深蓝”就用穷举法战胜了国际象棋世界冠军卡斯帕罗夫。但是对于围棋来说，其最大的魅力正在于在简洁的规则下，有无穷尽的策略带来无穷尽的变化。这样的情况下，依靠低效暴力的枚举并不能抵过一个专业棋手的经验和判断。蒙特卡洛算法的引入便是为穷举增加了一些随机性，缩小需要枚举的范围，在随机范围内寻求最优解即可。相当于在一片果园中要找到最大的那颗苹果，比起原来一棵树一棵树的找，变成只挑一块区域抽样找，最后找到的不一定是最大的那个，但一定是所选范围内最大的一个。虽然对穷尽所有的枚举有了一定的优化，但是蒙特卡洛算法在本质依靠的还是并不高明的列举，这样的算法只能在一定程度上进行优化，但并不能带来突破性变化。所以仅依靠蒙特卡洛算法导致许多围棋程式一度陷入瓶颈，包括Zen、法国的“疯石”、韩国的“石子旋风”在内的许多算法都依然无法匹敌高段位的专业围棋选手。AlphaGo的胜利像是在围棋算法这潭死水中放入一条大鱼，让围观群众错愕的同时重新活泛了业内同行的热情。比赛一个月后DeepMind便在《自然》杂志发表论文公开了Alpha Go革命性胜利的一小部分秘密：深度卷积神经网络的引入。AlphaGo每走一步棋，会列举250步潜在可能AlphaGo在蒙特卡洛算法的基础上构建两道神经网络：一道是策略网络，负责对棋局进行评估；一道是价值网络，判断应该在哪落子。这对于传统围棋算法最大的价值在于节省了蒙特卡洛算法的搜索空间。还用找大苹果举例的话，就是会先根据经验判断是不是应该找一块阳光好的地方，再判断哪块阳光好，找到大苹果的几率大。神经网络打破了机器算法和专业选手之间的差距，也为围棋算法优化提供了新的思路，包括加藤英树在内的许多开发者都在Google的论文之后把深度学习引入围棋算法。Zen在经过了深度学习升级之后也改名为今天的DeepZenGo。但Google在论文中公布的信息仍然只是AlphaGo的冰山一角。尽管用了同样的基础架构，但是DeepZenGo距离AlphaGo仍然有很大差距。首先是硬件不在同一水平，AlphaGo拥有1920个CPU、280个GPU，而最新的DeepZen 14.0版本的配备是44个CPU，4个GPU，这个差距相当于AlphaGo坐着火箭起飞的时候DeepZenGo还在骑共享单车。其次是算法的差距，AlphaGo共享了一份教材，但是各家的学习方法不同也就导致学校效果的不同。AlphaGo虽然研发时间不如DeepZenGo时间长，但是在深度学习上Google已经有了7年的经验，DeepZen即便引入了神经网络，模型训练的时间的量都远远不及AlphaGo。而无法对抗AlphaGo的DeepZenGo在众多围棋计算机中已经数一数二了，如果不是“绝艺”横空出道，它仍是这次UEC杯的第一，但如果连DeepZenGo也很难跟上AlphaGo的脚步，那其身后更多的AI小选手只能面临被淘汰。如同任何一样前沿技术，并非所有人都能因为跟随“潮流”而获利，除了几位掌握核心技术的佼佼者能够推动浪潮，更多的追随者面临的还是被浪潮吞没。有传闻说这届的UEC杯就是最后一届比赛了，大概也是因为这样的竞争没多少意义了。小玩家被淘汰，大玩家会继续竞争吗？也不见得，据说AlphaGo会在今年四月和号称目前最强的中国选手柯洁对战，赢了便会退出围棋界享受无敌的寂寞，然后将精力放在其他技术的攻破上，比如去年十一月开始在星际争霸游戏中的尝试。而游戏公司出身的DeepZenGo，可能还是会首先保住平民级游戏的这一战场，和群众打成一片，也未尝不是一条好出路。更多内容，关注品玩微信号：wepingwest限量开放入群申请……PingWest品玩的老朋友了？何不扫码加客服进群聊
“公地悲剧”展现的是一幅私人利用免费午餐时的狼狈景象——无休...
特斯拉公司和埃隆·马斯克在上个周末总算松了口气。
正当你被人工智能自由意识的觉醒而感动得稀里哗啦时，一束灯光照...当前位置 & &
& 厉害了！AlphaGo打完柯洁后还要一次打5位顶...
厉害了！AlphaGo打完柯洁后还要一次打5位顶级高手
12:45:29&&出处：&&作者：扬帆
编辑：朝晖 &&)
让小伙伴们也看看：
阅读更多：
好文共享：
文章观点支持
当前平均分：0(0 次打分)
[05-23][05-23][05-23][05-23][05-22][05-22][05-22][05-22][05-17][05-17]
登录驱动之家
没有帐号？
用合作网站帐户直接登录人工智能挑战世界围棋顶级高手 2016开启人工智能元年 - 新闻与热点 - 中钞海思信息技术（北京）有限公司
人工智能挑战世界围棋顶级高手 2016开启人工智能元年
继9日负于谷歌人工智能AlphaGo后，隔日围棋顶尖棋手李世石再次告负，在五番棋的比赛中暂时以0比2落后。这场世人瞩目的比赛在引起围棋界唏嘘的同时，标志着人工智能迈出了划时代的一步。围棋与人工智能围棋的复杂性世界公认，这个三千年前发端于中国的游戏变化路数层出不穷，被认为是一种极其复杂和富有变化的竞赛活动。几十年来，古老的围棋游戏一直是计算机难以涉足的领域。但是就在最近，《Nature》杂志以封面论文的形式，介绍了 Google DeepMind 开发的人工智能程序 AlphaGo，此前它在和其他围棋程序比赛的胜率达到了 99.8%，并以 5:0 的比分击败了人类欧洲围棋冠军樊麾。这是电脑程序第一次在全尺寸（19X19）的棋盘上击败了人类专业选手，这一成果过去认为至少需要 10 年才能实现。Nature 封面论文：Mastering the game of Go with deep neural networks and tree search（通过深度和搜索树，学会围棋游戏）围棋为何如此复杂？围棋被认为是人类发明的最复杂也是最美的游戏。自1997年IBM超级计算机“深蓝”击败世界冠军卡斯帕罗夫以后，人工智能程序开始不断的向人类博弈游戏的最后的堡垒围棋发起了挑战。虽然此前，也有人工智能程序战胜过一些业余围棋选手，但面对职业选手时，仍旧一败涂地。这是因为，国际象棋平均每回合有35种选择，而围棋每个回合则有250种可能，这250种可能中，每一种又有250种可能。围棋难的地方在于它的估值函数非常不平滑，差一个子盘面就可能天翻地覆，同时状态空间大，也没有全局的结构。这两点加起来，迫使以前的计算机只能用穷举法并且因此进展缓慢。而从对战的策略上看，国际象棋的目的就是杀王，子是越下越少；围棋的目的是圈地，子越下越多，地多者胜。而且，围棋还有手筋、劫争、弃子等战术战略层面的技法。国际象棋史上第二位世界棋王伊曼纽尔o拉斯克在评论国际象棋和围棋时，说过：“国际象棋是一种仅仅局限于这个世界的游戏，围棋则有些不像是从地球上诞生的。如果有那么一天，我们发现有一种天外文明和我们玩同一种游戏，那一定是围棋，决不会有任何疑问。”国际象棋的步数完全可以靠计算出来，而围棋除了计算能力，还与个人的思考方式有关。也就是说，与国际象棋人工智能相比，围棋人工智能更像是一个“人”。人工智能的发展之路人工智能（Artificial&Intelligence，英文缩写为AI）其实就是对人的意识、思维的信息过程的模拟，而人工智能机器人就是像人类一样具有自我意识的机器人。它是一门研究、开发用于模拟、延伸和扩展人的智能的理论及应用系统的技术科学，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能机器人就是像人类一样具有自我意识的机器人图片来自：pinterest 人工智能是计算机科学的一个重要分支，是一个极富挑战性的科学领域，它由不同的领域组成，如机器学习，计算机视觉等，是一门包括十分广泛的科学。普遍认为人工智能学诞生20世纪50年代中期，随后程缓慢发展状态。以从中国电子商务协会智慧城市委员会获得的信息来看，世界科学水平与物质生活等各方面的发展都符合指数曲线特征，即前面很长一段距离提升非常慢，然而，当发展突破某一点关键节点后，发展速度急剧提升，达到近乎垂直提升。回想近100年，世界上出现的新产品、新事物几乎是以前5000年的总和。&指数曲线人工智能也已经经历了一个漫长的发展过程，就棋类博弈领域而言，AI是否已到到达这个关键的转折点？1997年IBM公司的一个名叫“深蓝”的电脑第一次战胜了俄罗斯的国际象棋高手卡斯帕罗夫，震惊了世界。然而，9年之后，也就是2006年，国际象棋的人类高手最后一次战胜电脑，之后就下不过了，等于说从第一次战胜到完全超过人类，电脑用了九年，而且和电脑对抗智力，你这个阵地一旦一丢，将来好像再也没有夺回来的可能了。AlphaGo是新一代AI，它并不是通过简单的穷举这种机械式算法来运算的，而是以更接近人类的思维方式，通过策略网络与价值网络两套算法共同实现。它的强大之处在于，可以像人类一样，通过不断学习棋局来提升棋力，甚至可以通过自我对战来不断实践与提升。谷歌的Deep Mind团队给AlphaGO输入了海量的职业棋手的对局，而其自我学习演绎的对局数更是达到了3000万局。除了人机对弈，中国电子商务协会智慧城市委员会专家表示，针对模式识别（2D/3D、多维识别引擎等）、自动工程（自动驾驶、自动工厂等），包括专家系统、数据挖掘和知识发现在内的一批知识工程都将是人工智能的发展成果，可为更智慧的决策和行动提供支持，达到提高政府公共服务水平、企业竞争力和市民生活质量的目标，可谓通往智慧城市的“智慧之门”。未来人工智能将更进一步应用于城市智慧化建设中，给人们带来更多新奇体验的同时，让人们感受更加智慧的生活。在 AlphaGo 打败了欧洲围棋冠军后，世界冠军李世石和 AlphaGo 的对弈，是否会成为人类在围棋领域的绝唱？&从AlphaGo的算法原理来看，它在小规模战术上会非常厉害。它知道通过很多位置和类型找到人类最好的下法，所以不会在给定小范围的战术条件下犯明显错误。但是，AlphaGo有个弱点在全局判断上。它看到棋盘式通过5*5金字塔似的过滤，这样对于集成战术小块变成战略整体上带来麻烦。由于AlphaGo是没有情感的AI程序，不会因为棋局的变化而出现情绪波动，且已经具有了强大的传统棋手的思维模式，因此，中国电子商务协会智慧城市委员会相关学者认为，在李世石和 AlphaGo 的5局对弈中， AlphaGo至少胜一局，现在这个预言已经实现。相关链接：
Copyright(c)2014 中钞海思 All right reserved.&&京ICP备号- 或用以下帐号直接登录 -
下月对决顶级围棋选手李世石 Google能赢么?
来源：cnbeta网站作者：
下月对决顶级围棋选手李世石 Google能赢么?
　　摘要：在成功击败欧洲围棋冠军职业围棋二段樊麾之后，谷歌能继续赢下去吗？近日，谷歌旗下的DeepMind公司官网公布了更多关于“阿尔法围棋”(AlphaGo)与世界顶级围棋选手之一李世石人机大战的细节。比赛将于3月9日、10日、12日、13日、15日在韩国首尔进行，并在YouTube上全程直播。
　　杰米斯Hassabis将公布比赛的详细规则。其中杰米斯Hassabis将通过视频连接现场，李世石则在现场接受提问。
AlphaGo将在3月与世界顶级围棋选手之一李世石对弈（网络资料图）
　　此前，AlphaGo在没有任何让子的情况下以5
0击败了欧洲围棋冠军职业围棋二段樊麾，同时也击败了目前最好的围棋程序中99.8%的对手。现在，这场即将在今年3月进行的人工智能与围棋高手李世石的对阵：究竟各方胜算几何？人类智慧能否守住“围棋”这座堡垒？
　　胜算几何？
　　对于这场对决，李世石信心满满。他在一份声明中表示：“我很荣幸能够对战谷歌发明的人工智能系统。我认为，这将是围棋史上最重要的一场比赛。因此我接受了挑战。我很有信心赢得比赛。”
　　此前，职业二段棋手、围棋资深教练刘轶一对《第一财经日报》称，不用担心，不会那么容易。不过他所在的朋友圈里，围棋职业棋手们众说纷纭，有些认为不可能，有些认为指日可待，还有声音是“人类快被自己灭绝了”。
　　判断的预测认为，AlphaGo和李世石取胜的可能性为五五开。
　　而谷歌DeepMind工程总裁德米斯·哈萨比斯（杰米斯Hassabis)则表示：大部分围棋棋手都认为，李世石的赢面占优。“他们认为，我们取胜的可能性不到5%，但他们不知道的是，我们的系统有着多大的进步。就在我和你们交谈时，这一系统也在进步。”
　　事实上，AlphaGo在没有任何让子的情况下以5
0击败了欧洲围棋冠军职业围棋二段樊麾的事情，并非发生在今年1月，而是在去年10月，这意味着AlphaGo在与李世石比赛前，有近5个月的时间进行学习。
　　而搜狗CEO王小川的判断则更为大胆。他提出了自己的两个断言，断言一：AlphaGo将会完胜李世石；断言二：除了围棋，人工智能在其他博弈类的封闭游戏里也会横扫一切，完胜人类。
　　谷歌凭什么？
　　在此前，谷歌人工智能程序AlphaGo是如何击败围棋高手的？
　　谷歌AlphaGo的研究者大卫·
Silver说，AlphaGo系统的关键是，将围棋巨大无比的搜索空间压缩到可控的范围之内。
　　而为了达到这一目的，AlphaGo系统将最先进的蒙特卡洛树状搜索技术与两个深层神经网络相结合，每个深层神经网络均包含许多层，每层又包含数以百万计的神经元一样的连接。
　　在AlphaGo两种不同的神经网络中，“策略网络（策略network)”的作用是预测下一步，并用来将搜索范围缩小至最有可能硬起的那些步骤。另一个神经网络“价值网络(value
network)”则是用来减少搜索树的深度，每走一步估算一次获胜方，而不是搜索所有结束棋局的途径。
　　上述方法使得AlphaGo的搜索方式相比之前的方法更人性化。例如，深蓝采用强力方法搜索的棋子位置要比AlphaGo多数千倍。而AlphaGo则相反，它通过想象下完剩余棋局来对下一步进行预判，如此多次反复。在上述模拟游戏中，策略网络提出下一步的智能建议，而价值网络则对走过的每个位置进行评估。
　　具体而言，Google首先采用围棋专业棋手的3000万步下法对价值网络进行训练，直到该网络对人类下法预测准确率达到57%（AlphaGo之前的纪录是44%）。
　　但AlphaGo的目标是击败水平最高的人类棋手，而不仅仅是模仿他们。为了做到这一点，AlphaGo学会自己发现新策略，通过自身两个神经网络之间成千上万的对弈，采用被称为强化学习的试错法逐步进行改善。这种方法提高了策略网络的效率，以至于最原始的神经网络（即其中不包含任何树状搜索）可以击败最尖端、构建有巨大无比的搜索树的围棋软件。
　　这些策略网络又反过来对价值网络进行训练，采用的还是从自我对弈强化学习的方法。这些价值网络可以对围棋的任何位置进行评估并预测获胜方，而人们过去曾认为这个问题太过困难，根本无法实现。
　　如果在今年3月的对战中，AlphaGo战胜李世石，是否意味着人工智能已经超过人类？
　　或许还不能如此断言。但在棋类游戏之外的领域，这场对决也将引发更多的思考——那些人们曾经以为人工智能不可能完成的脑力挑战，是否都将被一一打破？未来人类是否会被人工智能所取代？相比这些问题，100万的奖金显得并不是那么重要了。
欢迎关注“南方新闻网”公众号（微信上长按二维码识别）
请文明发言，还可以输入140字
您的评论已经发表成功,请等候审核
小提示：您要为您发表的言论后果负责，请各位遵守法纪注意语言文明
新闻关键词
为进一步推动广东省大学生深入学习《习近平总书记系列重要讲话读本》（2016年版），增强中国特色社会主义的道路自信、理论自信、制度自信，为实现中华民族伟大复兴的"中国梦"贡献智慧和力量，广东省委宣传部、南方网决定在全省普通高等学校大学生中开展"党中央治国理政新理念新思想新战略知识竞赛"活动。}

米需爱网