如果让你根据与电脑对弈围棋下棋的特点和他对弈,你将怎样战胜它?

年轻人忙于工作无暇恋爱,父母聚集公园“摆摊”相亲。
裸身模特展示人体行为艺术,呼吁公众保护生态环境。
声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
  人机大战&阿尔法围棋
  能深度学习,一天玩100万局
  不会疲劳和害怕,比“石佛”还冷静
  李世石在21年的围棋职业生涯里已赢得多次世界第一,“阿尔法围棋”距第一次战胜职业选手还不足21周。但“阿尔法围棋”已进行过超过3000万局的训练,比李世石在有生之年能下的棋局要多得多。
  更重要的是,“阿尔法围棋”会像人类那样凭直觉选择最佳下法,懂得舍弃局部,以取得全盘的胜利。
  第一个击败人类职业棋手的 电脑程序
  围棋一直被看作是人类最后的智力竞技高地。据估算,围棋的可能下法数量达到10的171次方,超过了可观测宇宙范围内的原子总数(10的80次方)。
  单靠穷举所有的可能性来选取最佳方案,计算机目前的运算能力还达不到这个量级。不过,“阿尔法围棋”是人工智能。它模仿人类的思维方式。
  让我们从名字开始来了解它。“阿尔法围棋”的英文名AlphaGo由两部分组成,Alpha对应希腊语的首字母,也就是常说的“阿尔法”,Go是日语中对围棋的称呼。因此,许多人称之为“阿尔法围棋”,还有人根据发音亲昵地叫它“阿尔法狗”或“阿狗”。
  它出生在英国。2010年,德米什&哈萨比斯等人在伦敦创建了“深度思维”公司,2014年开发出了“阿尔法围棋”软件。2014年,美国谷歌公司收购了“深度思维”,因此它现在也许算是美国籍。
  此前与法国“疯石”、日本“zen”等当今最优秀围棋程序进行的500盘博弈,“阿尔法围棋”只输了一盘。
  它的成名是在今年1月。哈萨比斯等人在英国《自然》杂志上发文说,在英国围棋协会见证下,“阿尔法围棋”以5∶0战胜欧洲围棋冠军、前中国职业棋手樊麾,成为第一个击败人类职业棋手的电脑程序。
  明知该怎么杀,而没有杀
  “第一盘结束之后我当时的心情非常不好。为什么呢?道理很简单――电脑第一次打败职业棋手,这是个历史时刻,这是以前从来没有过的事情,但我是真真正正地输了。”樊麾说。
  樊麾对“阿尔法围棋”的厉害之处印象极深。
  他说:“它抓我的错抓得特别准,只要一抓住我就跑不掉,而且只要我一犯错,棋局就进入它的轨道了,我就再也翻不了身了。后面每盘棋基本都是按照同样的步骤走下去的,但它没犯什么错。”
  更令人惊讶的是,“阿尔法围棋”有时明明看出了樊麾的失误,却故意放过。
  “在第三盘棋中,有一块棋我是死棋,它很简单就能吃我,却没有吃,让我活了。”樊麾说,“如果当时它吃我会有一点点风险,棋局会变得更加复杂,但它不吃我,它就会很轻松地赢下这盘棋。最终它选择了一种更稳妥的策略,选择了轻松获胜。”
  后来有围棋节目对这场比赛进行复盘,一位专业棋手也是认为当时“阿尔法围棋”知道怎么杀,而它没有杀。
  樊麾说:“因为在实战中,它放我活之后没几个棋我就认输了。它如果不放我活,那我可能还会继续战斗下去,棋局就会出现一些复杂变化。就像(中国棋手)柯洁所说,他也看不出来是人还是电脑。谁也看不出来。”
  “如果没有人告诉我,我一定不知道它是电脑,它太像人了。它一定是在思考。按照人的说法,它应该有棋风吧。”他说。
  棋力又有大长?
  “阿尔法围棋”为什么可以这么厉害?
  “深度思维”公司并没有开放软件的代码。要想了解它,目前还主要靠《自然》上的那篇论文。
  专家认为,“阿尔法围棋”最大的特点是,它会自己学习!
  它的学习方式主要是:
  第一步,快速判断。用于快速地观察围棋的盘面,类似于人观察盘面获得的第一反应。
  第二步,深度模仿。它模仿学习近万盘人类历史高手的棋局,用得到的经验进行判断。这个深度模仿能够根据盘面产生类似人类棋手的走法。
  第三步,自我对弈。不断与“自己”对战,一天就能玩100万局,总结出经验作为棋局中的评估依据。在战胜樊麾之前,“阿尔法围棋”已进行了超过3000万局的自我训练,不断提升自身棋力。
  第四步,全局分析。利用第三步学习结果对整个盘面的赢面进行判断,实现从全局分析整个棋局。在观察棋子的整体布局的基础上选择最佳下法,这种方式十分接近于带着直觉和第六感作出判断的人类大脑功能,颇有人类棋手“我感觉这样会赢”的味道。
  从技术层面上讲,“阿尔法围棋”的核心是两种不同的深度神经网络――“策略网络”和“值网络”。
  “值网络”负责减少搜索的深度,一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑。“策略网络”负责减少搜索的宽度,面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。它们“双剑合璧”挑选出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。
  “阿尔法围棋”和樊麾之间的比赛发生在去年10月,只是由于论文发表的保密流程等原因才在今年宣布。虽然许多围棋高手研究比赛棋谱后认为,“阿尔法围棋”那时的棋力还无法与李世石相提并论,但几个月过去了,它可能又在针对性训练中大有进步。
  这也是现在许多人押注它会取胜的原因。
  它是一堵墙
  “阿尔法围棋”学到了人类思维的优势,同时没有人类的某些弱点。
  1997年,当时世界排名第一的国际象棋大师卡斯帕罗夫在和“深蓝”超级计算机对决中,第二局的完败让卡斯帕罗夫深受打击,他的斗志和体力在随后3局被拖垮,在决胜局中仅19步就宣布放弃。
  2006年,“浪潮杯”首届中国象棋人机大战中,5位中国象棋特级大师最终败在超级计算机浪潮天梭手下。其中一位特级大师张强说:“输的原因主要在体力的过度消耗。以往和人比赛,到了最后时刻就是意志和心态的对决了,看谁能坚持到最后,谁能不犯错误。但是计算机没有这样的问题。”
  樊麾说:“当年击败众多高手的李昌镐,被称为‘石佛’,就是因为他心态特别好,面无表情,你感觉不到他的任何波动。但我想说的是,谁能比电脑更‘石佛’啊?”
  他把“阿尔法围棋”形容为一堵墙,“你对它施展任何压力它都会反弹给你”。
  哈萨比斯说:“‘阿尔法围棋’的优点是不会疲劳和害怕。它经过多次测试,性能出众,但应该还存在没被发现的弱点。”
  李世石认为,“阿尔法围棋”模仿人类的直觉判断程度约为80%,但运算速度优于自己,所以要格外小心。“不过听到人工智能具有了类似人类的直觉判断能力,我倒感到有些紧张,恐怕我以5比0战胜它有点儿够呛,因为人类下棋时会有失误。”
  如果输掉首盘,接下来的比赛会不会受影响?
  李世石说,在与人对局中首盘输掉的时候很多,这次与人工智能对弈即使输掉首盘也不太会对接下来的比赛有影响,自己也肯定会从与人工智能的对弈中学到很多。(综合新华社报道)
  阿尔法围棋
  生日:2014年
  年龄:2岁
  出道时间:2015年10月
  性别:无
  身高:无
  体重:无
  处理能力:服务器版本,具体计算能力保密,比赛后公布
  国籍:美国
  段位:保密
  正式战绩:5胜0负
  最高成就:击败欧洲围棋冠军
  行棋风格:稳健实用派
  兴趣爱好:电子游戏
欢迎举报抄袭、转载、暴力色情及含有欺诈和虚假信息的不良文章。
请先登录再操作
请先登录再操作
微信扫一扫分享至朋友圈
搜狐公众平台官方账号
生活时尚&搭配博主 /生活时尚自媒体 /时尚类书籍作者
搜狐网教育频道官方账号
全球最大华文占星网站-专业研究星座命理及测算服务机构
把给读者一份好看的报纸为目的。一张有鲜活的新闻、漂亮的版式...
3992文章数
主演:黄晓明/陈乔恩/乔任梁/谢君豪/吕佳容/戚迹
主演:陈晓/陈妍希/张馨予/杨明娜/毛晓彤/孙耀琦
主演:陈键锋/李依晓/张迪/郑亦桐/张明明/何彦霓
主演:尚格?云顿/乔?弗拉尼甘/Bianca Bree
主演:艾斯?库珀/ 查宁?塔图姆/ 乔纳?希尔
baby14岁写真曝光
李冰冰向成龙撒娇争宠
李湘遭闺蜜曝光旧爱
美女模特教老板走秀
曝搬砖男神奇葩择偶观
柳岩被迫成赚钱工具
大屁小P虐心恋
匆匆那年大结局
乔杉遭粉丝骚扰
男闺蜜的尴尬初夜
客服热线:86-10-
客服邮箱:…………发现好多知友回答了,这个问题,在此表示感谢!…………其实我想的绝顶聪明的电脑,则意味着他们能够预测出对手下一步的路数,而对方也会根据对方的预测进行调整
拼电脑的配置(或者说拼算力)以前加过一个棋类群,进去里面都在讨论怎么配电脑,配的都是10000左右的,一问,原来是开2台,一台和人网下,一台运算,如果对方也是如此的话……就得不停提升自己电脑的算力,我建议他们去租大型机,被群主踢了。
借着阿尔法狗的风头来更新一波。&br&棋类运动,甚至人类历史上,发生过无数次,弱小一方对面优势大到不可能输的一方,却发生了绝地大翻盘的事情。抛去东方神秘力量之类的因素,这种事情一般只有三种可能:&br&一、弱势一方运气逆天;&br&二、所谓的优势其实是幻觉,是误判;&br&三、优势方犯了巨大错误。&br&&br&大多数棋类运动,包括围棋,不存在运气问题,所以第一条我们先不考虑。&br&&br&李世石对AlphaGo的第一场其实就是第二种情况。下到中盘的时候,我看的直播说只要李世石不犯错,基本就不会输了。下完后的复盘结论是,当时优势其实在AlphaGo一边。这就引出一个很严肃的结论:人类的判断可能跟真实局势相差甚远。如果绝顶聪明的电脑能判断出真实局势,那么它眼中的局势很可能跟你看到的完全不一样。&br&&br&这局势有多不一样?很可能人觉得自己占据优势的时候,绝顶聪明的电脑觉得人已经输了。如果此时换成两个人来接着下棋,还能下得有来有回,但在绝顶聪明的电脑眼里,这不过是菜鸡互啄罢了。&br&&br&我举一个星际中的例子:&a href=&///?target=http%3A///v_show/id_XMjU3NjIyODM2.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&星际2 超级AI梦幻级微操 小狗冲坦克阵&i class=&icon-external&&&/i&&/a&&br&100条狗冲20个架好的坦克阵,谁会赢?如果是人来打,坦克大比分赢;换成电脑,小狗大比分赢。人会觉得坦克优势无限大,但如果双方都完美操作的话,坦克一点机会都没有。&br&&br&那么优势方犯错呢?当然,绝顶聪明的电脑应该不会犯错。AlphaGo不是绝顶聪明,第四盘它犯错了。当然它也算非常聪明了,很快它就意识到自己劣势了,之后它怎么下的?它在乱下。为什么?因为它的学习过程里包含大量自己和自己对弈的过程,所以它默认它是在和另一个接近绝顶聪明的对手下棋。绝顶聪明的对手不会犯错的;绝顶聪明的棋手不会挖坑给对面,因为他知道绝顶聪明的对手不会往下跳。所以乱下并无所谓,反正无论怎么走都是挣扎;只要对面不犯错,自己怎么走都是输了。。&br&&br&所以这里有个思考题:如果有一步棋,你这么下了,对面只要应对正确,就必赢。但是对面中间随便一步出现最微小的偏差,你就立刻赢了。那么,你会不会这么下?或者简单的来说,你会不会卖个破绽给对面?&br&&br&反正绝顶聪明的电脑不会。关羽使拖刀计阵斩了不少对手,不过如果是绝顶聪明的电脑来的话,它会直接从上去把武圣砍了。&br&&br&绝顶聪明的电脑就是这么无趣。&br&&br&================================================&br&如果真的是聪明绝顶的电脑,那情况只会是以下三者之一:&br&电脑1开局求和,电脑2接受(和)&br&电脑1开局认输,电脑2接受(先手输)&br&电脑1开局下了一步,电脑2认输,电脑1接受(先手赢)&br&&br&补充一下,常见的围棋象棋之类的棋是finite sequential game of perfect information。&br&finite是指有限步内结束,比如国际象棋规定三次重复局面等情形:&a href=&///?target=http%3A//zh.wikipedia.org/wiki/%25E5%E5%25B1%E5%259C%258B%25E9%259A%259B%25E8%25B1%25A1%25E6%25A3%258B%29& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&和局 (國際象棋)&i class=&icon-external&&&/i&&/a&;中国象棋也有类似的规定。这些规定保证这些棋不可能永远下下去。&br&sequential game则是指博弈双方轮流做决定,和双方同时做决定的simultaneous game相对应。前者例子就是各种下棋,后者例子有猜拳。&br&perfect information是指双方完全掌握所有信息。perfect information的例子包括所有明棋;imperfect game的例子包括大多数牌类游戏,军棋,带战争迷雾的RTS(红警手动斜眼)。&br&&br&&a href=&///?target=http%3A//en.wikipedia.org/wiki/Zermelo%2527s_theorem_%28game_theory%29& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Zermelo's theorem (game theory)&i class=&icon-external&&&/i&&/a& 策梅洛定理说明,对于这类游戏,如果其中不包含随机因素(单指棋盘上的随机因素,比如发牌扔骰子。下棋的电脑被断电这类随机因素不算),那么可以通过递归推导使得至少一方获得必不败策略。&br&&br&如果不要求排除随机因素,则这类游戏保证有pure strategy equilibrium。也就是说,均衡状态下,双方有确定策略,但是不保证确定结果。&br&&br&与pure strategy equilibrium相对的是mixed strategy equilibrium,混合策略。例如,石头剪子布里面,均衡状态下就没有确定策略(你确定出剪刀的话一定会被确定出石头的克),只有混合策略(双方出手前按1/3,1/3,1/3的概率随机决定是石头还是剪刀还是布)。&br&&br&总结一下就是,&br&&br&如果是有限步内结束,双方轮流移动,局势对双方透明,不含随机因素的棋类游戏,则一定有确定的最优策略,以及对应的确定的结果。(象棋,围棋)&br&&br&如果是有限步内结束,双方轮流移动,局势对双方透明,包含随机因素的棋类游戏,则一定有确定的最优策略,以及对应的不确定的结果。(大富翁)&br&&br&如果是有限步内结束,双方轮流移动,局势对双方不完全透明的棋类游戏,则至少一定有混合的最优策略,以及对应的不确定的结果。(军棋;梭哈)&br&&br&===============================================================&br&&br&有人说这不是绝顶聪明而是预知未来,这是不对的。即使游戏中有随机因素,信息也不透明,但博弈树是确定的,计算机可以把所有可能结果以及对应概率都算出来,进而算出最优策略,简单的伪代码只要几十行就可以写清楚。&br&&br&这结论与一些常识违背是因为,大多数情况下这棵博弈树太特么大了,大到现在最强的电脑做不到,可预见的将来也做不到。典型例子如围棋,状态数大概有一亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿这个级别。但题主问的是绝顶聪明的电脑,那咱就不考虑这麻烦了。&br&&br&==============================================================&br&&br&有些人可能不明白博弈树、必败态之类的概念,或者觉得为什么开局认输太傻了,一定要下到输。其实如果真的遍历完博弈树的话,在哪一步认输并没有区别。因为双方都计算力很高把博弈树遍历了,一方发现自己处于必败态,那么往下走就没意义了,因为你无论怎么走都是必败态,只要对手不失误,那就是从失败走向失败。&br&&br&我举一个简单的例子,很多人都玩过井字棋(tic-tac-toe)。这个棋只有两万多种棋局,用电脑很容易搜完所有节点。如果双方都不犯错的话,结果只能是和棋。普通人甚至多玩几次就可以发现必不败走法。两个熟悉井字棋的成年人是不会玩井字棋的,因为这棋太简单以至于开始下之前胜负就分明了。我们觉得象棋、围棋之类的没有必胜走法,只是因为这棋太复杂,无论人还是电脑都无法遍历整个博弈树,甚至只能推算到几步之后。&br&&br&所以在计算力不足(也就是不够绝顶聪明)的情况下怎么玩,是棋类的魅力所在。我抛个砖,电脑常用的算法是,不搜索整个博弈树,而是通过宽度或广度优先搜索加剪枝遍历接下来的若干步的可能走法(印象里当年的深蓝能往后推12步),并给每个最终状态打分(例如后100分,车50分,兵5分,关键位置200分,等等,数字是我胡诹的)来评判局势的好坏。
借着阿尔法狗的风头来更新一波。棋类运动,甚至人类历史上,发生过无数次,弱小一方对面优势大到不可能输的一方,却发生了绝地大翻盘的事情。抛去东方神秘力量之类的因素,这种事情一般只有三种可能:一、弱势一方运气逆天;二、所谓的优势其实是幻觉,是误…
这事儿我还真干过。&br&&br&高三的时候,卡西欧的电子辞典里面有象棋的游戏,高级的模式太强,怎么也下不过。&br&&br&一怒之下,又问同学借了一台机子。同时调到高级,开始互相对弈。就是这边怎么走,立马就复制到另一台机子上,看它怎么回,然后再在那台机器上走。&br&&br&最后的结果嘛,一台机器眼看大势不好,居然耍赖,开始连续消极将军……&br&&br&这坑爹的结果,花了我整整一个晚自习,害得我补作业补到天亮233&br&&br&————————————————————————————————————————&br&容我再歪个楼哈,很多人说这台学习机“太无耻了”,对此我只能表示……图样图森破。&br&&br&在我短短的人生里,见过最牛逼的学习机是下面这个。&br&&br&还记得是高一的一个中午,和基友拿着好记星学习机下象棋。&br&本来势均力敌,对方只是略占上风。然后,他随手跳了一步马,然后……&br&&br&然后!!&br&&br&那马突然,变成了一个車!!&br&一个货真价实的車啊!!!&br&尼玛这什么情况!!!!&br&&br&微妙的平衡就此打破,在对方三个車的围剿下,我很快被剃成了光头(呵呵)&br&&br&最后上图,临死前的惨状……&br&&img data-rawwidth=&2592& data-rawheight=&1944& src=&/3eda08a6d502ebc59568f6e_b.jpg& class=&origin_image zh-lightbox-thumb& width=&2592& data-original=&/3eda08a6d502ebc59568f6e_r.jpg&&
这事儿我还真干过。高三的时候,卡西欧的电子辞典里面有象棋的游戏,高级的模式太强,怎么也下不过。一怒之下,又问同学借了一台机子。同时调到高级,开始互相对弈。就是这边怎么走,立马就复制到另一台机子上,看它怎么回,然后再在那台机器上走。最后的结…
已有帐号?
无法登录?
社交帐号登录
该用户不存在& 新闻客户端 &
两台绝顶聪明的电脑下棋对弈,谁会赢? 理由是什么?
@晓风残月 和 @慧航讨论了棋类游戏作为finite game of perfect information的情况,这里我补充一下infinite game of perfect information的情况。很多人已经指出了Zermelo's theorem,正好知道GEB有篇文章(http://www.labri.fr/perso/gimbert/enseignement/enseirb/zermelo.pdf)对Zermelo's theorem以及其他人的工作的阐释,理清了一些广泛存在的误解,甚至翻译了Zermelo的原文。这里介绍一下在descriptive set theory里的相关内容,考虑一个game tree:
由game tree上的所有node组成。存在一个root,,即任取, 。
指派给所有node一个player。这个player将在从行动集合中选择一个行动。
可由到达的行动序列递归定义:, for 如果 ,则 for 。所以,如果存在使得,则。
Remark:我们的这个设定还是比较一般的:它不要求当一个player选择完行动后,接下来的player一定是其他的player。它也对每条path的长度也没有限制,可以在有限步内结束,也可以永远的进行下去。
在这个game tree上所有的outcome构成的集合,记为
我们定义,在这个game tree的outcome set,, basic open set(生成所有开集的开集)的形式为: 对于某个自然数,
所谓一个游戏规则,对应于一个定义在的函数:
对于player I,
对于player II,
Remark:并不是所有效用函数都保证maxmin value等于minmax value,(见以前我答过的Bernstein set的例子:设某个纯策略博弈的纳什均衡不存在,那么相应的混合策略博弈的纳什均衡会存在吗? - 长泽雅美的回答)。也就是说,如果允许使用选择公理的话,我们可以说存在一个游戏规则使得没有人可以获胜。
Observation:我们已知的棋类游戏都是在有限步骤内判定一方获胜,或者因为双方陷入无限重复某局面而被判定和棋。这对应的情况为,并且它们的原项均为 集合,也就是闭集合的可列并。
定理(Donald Martin):当 为一个Borel measurable函数,则。
这个定理太过强大,我们其实只需要如下的定理:
定理(Philip Wolfe):当获胜集为集合时,则。
References:
[1]:Martin, Donald A. &Borel determinacy.&
Annals of Mathematics (1975): 363-371.
[2]:Mycielski, Jan. &Games with perfect information.&
Handbook of game theory with economic applications 1 (1992): 41-70.
[3]:Schwalbe, Ulrich, and Paul Walker. &Zermelo and the early history of game theory.&
Games and economic behavior 34.1 (2001): 123-137.
[4]:Wolfe, Philip. &The strict determinateness of certain infinite games.&
Pacific Journal of Mathematics 5.1 (1955): 841-847.
(本文来源:知乎每日精选
没有相关新闻
用微信扫描二维码分享至好友和朋友圈AI战胜人类职业棋手,围棋界怎么看?围棋天才柯洁:如果AI下赢了我,我还想赢回来 -- 果壳网 -- 传送门
AI战胜人类职业棋手,围棋界怎么看?围棋天才柯洁:如果AI下赢了我,我还想赢回来
日,权威学术期刊《自然》宣布,,并宣布将于3月挑战世界顶尖选手李世乭。对于这次败给AI,樊麾表示:“在中国,围棋不仅仅是游戏,还是生活的写照。人们常说,如果你的棋局有问题,也许你的生活也出现了问题。输棋很艰难。在和AlphaGo下棋之前,我觉得我会赢。第一局棋之后,我改变了策略,进攻得更多,但我还是输了。人类的问题是,我们有时会犯下大错,因为我们是人。我们会疲劳,会因为太过想赢而承受压力。但程序不是这样的。程序很强大,很稳定,就像是一堵墙。对我来说,这个区别很大。我知道AlphaGo是电脑,但如果没人告诉我,我或许会觉得对手是个有点奇怪,但非常强大的人,一个真实的人。樊麾。图片来源:Nature当然,我输棋的时候并不高兴,但所有职业棋手都会输棋。输棋之后,我会研究这盘棋,也许会改变下法。我觉得这对今后来说是件好事。”这一消息同样令整个围棋界惊讶,很多围棋职业选手也对这次比赛发表了自己的看法:
梁宰豪(韩国围棋协会秘书长,职业九段)梁宰豪。图片来源:“我们十分乐见谷歌Deep Mind的发展,以及它与李世乭的对弈。这对全世界的棋手来说都是一场盛事。至于结果,电脑也许会赢一两场棋,因为李世乭还没和任何强大的AI下过棋,但电脑总得来说能不能占上风,我表示怀疑。”
李夏辰(韩国棋手,国际围棋联盟秘书长,职业三段):李夏辰。图片来源:Nature“第一次听说电脑要挑战顶级棋手李世乭时,我非常惊讶。我觉得挑战者一定对顶级棋手有多强毫无概念,但事实上,是我对电脑有多强没有概念。现在,我感到非常激动。谁会赢?我也不知道。李世乭自己怀疑电脑没有他强。但就我个人而言,我听说了一些有关AlphaGo的事情,我被它有多强大震惊了。我自己也知道李世乭有多强,所以我觉得几率是一半对一半吧。我觉得围棋还有许多价值有待开发,也并不觉得AI能下过人类这件事在任何意义上让围棋”贬值“了。我觉得人们会接受计算机技术的进步了,并寻找到利用技术的方式。”而作为本次比赛的裁判,英国围棋协会司库托比o曼宁(Toby Manning)则表示:“围棋手们都知道围棋是人工智能尚未攻破的领域之一,所以,我觉得人们的预期是电脑的确会达到职业棋手的水平,但那也是在十多年后。在这场比赛中,我原以为樊麾会赢。在比赛过程中,让我印象最深的是你分不出谁是人类,谁是计算机。在许多软件中,电脑会走出许多步好棋,然后突然开始摸不着头脑。但对AlphaGo和樊麾来说,你分不出谁是谁。托比o曼宁。图片来源:NatureAlphaGo和人类不同的地方之一是它管理时间的方式。樊麾每步所花的时间比AlphaGo更长。AlphaGo的进攻性似乎也没有人类那么强。它的下法非常平稳,而不是通过占地或吃子向对方发起进攻。就像深蓝达到国际象棋大师级别时那样,我觉得围棋界都想去试试这个软件,对弈一番,看看自己在哪里出了差错。”而曾三夺世界冠军、目前名列中国围棋等级分第一的柯洁,则在他的微博上表示:“震惊!!虽说看棋谱感觉水平有限...但可怕的是这还不是完全体,它是可以学习进化的...”柯洁1997年9月出生于浙江丽水,今年还不到19岁。他6岁学棋,11岁冲段成功,17岁就以3:2击败邱峻九段,获得他的首个世界冠军;2016年1月,柯洁在第二届梦百合杯世界围棋公开赛决赛的中以3:2的成绩战胜韩国著名棋手李世乭九段,第三次夺得冠军。可以说,他是今天中国最令人瞩目的少年围棋天才了。梦百合杯决赛中的柯洁。图片来源:新华网围棋的真正传统在中日韩三国。谷歌AI虽然战胜了欧洲冠军,但是中国的顶尖棋手又如何看待它的表现呢?这一点上,柯洁很有话说。果壳网:过去你和电脑下过围棋吗?这次AlphaGo的成绩让你意外吗?柯洁:小时候买过专门的围棋软件光盘,不过那个时候的水平,以现在的我来看,太弱了,实在太弱了(笑)。那时候我刚学棋,学了半年左右的时间,就能和电脑抗衡了,甚至还比他略强一些。那个时候的围棋AI明显是不行的。后来他们也研究了各种各样的程序,比如日本的那个ZEN,到现在的话职业棋手让它四到五个子,也是没有问题的。所以现在AI战胜人类冠军,虽然是欧洲的(笑),但是也是一个质的飞跃,当时看到时我也非常震惊,所以也转发了。很快我的朋友圈之类也都是爆掉了,都是今天这个消息。太不可思议了。我也是经常和别人吹嘛,说围棋不像象棋什么的,电脑是暂时破解不了的。大部分人都觉得,未来十年内电脑都不太可能战胜专业棋手,甭管是欧洲的还是其他国家的。这次既然能战胜,说明已经非常了不起,太超级啦,太超级啦。我原来预计是至少十年,现在看来两年到三年之内就能达到顶尖水平了。果壳网:假如是不知情地去看AlphaGo和樊麾的这五盘棋,你会猜到AlphaGo不是人类吗?柯洁:完全看不出来。这五盘棋我也仔细地看了一眼,但我没看名字,不知道谁执黑谁执白,完全看不出谁是AI。感觉就像是一个真正的人类下的棋一样。该弃的地方也会弃,该退出的地方也会退出,非常均衡的一个棋风,真是看不出来出自程序之手。因为之前的ZEN那样的程序,经常会莫名其妙的抽风,突然跑到一个无关紧要的地方下棋。它这个不会。它知道哪个地方重要,会在重要的地方下棋,不会突然短路。这一点是非常厉害的。果壳网:就电脑的表现来看,你对它布局,中盘,官子三个阶段的评价,分别是什么水平?柯洁:按照我的评价,它的水平大概就是冲职业段之前的水平,虽然职业还到不了,但是无限接近于职业了。关于这几个阶段,我的感觉是都差不多,非常均衡,也看不出哪个地方是机器,这个很恐怖(笑)。当然这只是看了五盘棋,也看不出它的短板来,可能是因为对手发挥得太糟糕了(笑),我也看不出来具体的哪里好哪里不好。AlphaGo和樊麾的五盘棋。图片来源:Nature论文果壳网:AlphaGo三月份将和李世乭老师对战,你觉得谁的赢面会大一些呢?柯洁:从这五盘棋展示出来的实力来看,李世乭必胜无疑。但是这其实是10月份下的棋对吧,这半年期间可能又有一个飞跃,那我就不知道了,它也会学习嘛。但从现在来看,我还是谨慎看好李世乭的。二者的差距,我们有人评价说,大概是让先、倒贴目不到一点的水平。注:围棋因为有先后手,原则上来说先下的一方(黑棋)会有优势,所以各地规则中会规定在最终结算时,黑棋“补贴”白棋一部分;譬如按照中国规则,黑棋185子赢,白棋177子就能赢。“让先”,就是放弃补贴,允许弱者执黑先下,谁181子谁赢。加上“倒贴目”,就是把补贴反过来,黑棋177子就赢,白棋反而要185子。倒贴目的优势介于让先和让两子之间。但这段时间我不知道它会有什么长进。我也不太懂电脑,所谓的“脑盲”(笑),但我们围棋界也有研究软件的,我们的俞斌老师(中国围棋队总教练)就是做这个方面的。他觉得这个事情完全不可思议,下起来太像人了。我一开始看到的时候都怀疑这个消息的真实性,但既然他们说是真的,那我也还是相信是真的吧。不过我觉得李世乭多半还是会赢的。谷歌这次可能是有点挑战得太早了,可能应该再成熟一年的时间,再沉淀一下。我觉得这可能太着急了。如果输的话,可能会输的很惨,下五盘输个零比五,白送李世乭一百万美元。但这个广告效应是达到了嘛,大家都听到他们吹了(笑)。果壳网:如果有机会,你想和AlphaGo下几盘吗?会采用什么战略战术来应对呢?柯洁:我当然非常想和它下了!当然不是为了钱或者什么的,而是想看看自己到底有什么实力。因为它和樊麾下的这五盘棋,其实是樊麾下得太糟糕了我觉得,完全是……有点看不下去,没法看的(笑)。甚至大家对这个棋谱都有很多质疑,怀疑他是不是有意放水,搞不清楚。他可能也是好久不下棋了,实力表现非常糟糕。但不只是我想下,我们棋院可以说所有人都想和机器一战,都想挑战一下这个“阿法狗”。我觉得只要是懂点围棋的都会想和这个计算机高手下一盘吧!都非常期待看看它到底有多大的实力,有多大的能量。我觉得我去下的话也非常有信心能战胜这个阿法狗。这是就现在来说啊,以后不知道。2014年第二届百灵杯赛场上的柯洁。图片来源:新浪体育果壳网:你刚才说到围棋最困难的棋类运动之一。你有没有下过别的棋?你觉得围棋到底难在何处呢?柯洁: 其实我别的棋都很糟糕啦,而且我也是有意的避开这些棋类,因为我怕要是学了比如象棋和国际象棋,下围棋的时候就会有分心,所以不敢学得太深,也不敢太多评价。我觉得,大概是围棋的路数要广很多吧!象棋是九乘九,围棋是十九乘十九。围棋一个子如果被吃了,还可以吃回来,可以反复来回吃来回吃,所以是天文数字,算出来几十位几十位我都不看的。还有一个判断的问题。象棋或者国际象棋,一个子如果被吃了,场上的优势可能很明显;但围棋不是的。围棋是你一个小地方失误之后,可能未必会发觉自己形势不利,因为非常广阔嘛。然后你的优势也非常难把握。围棋的“虚”的东西非常多,我们这帮职业选手都认为计算机不可能掌握这种人类对“虚无”的感受,这种大局感觉;但是这个AI基本上还真的是做到了,非常了不起。果壳网:那么说,围棋是非常依赖于直觉或者说“棋感”的是吗?柯洁: 大部分人棋下多了之后,都会知道棋往哪里下,知道这个就是一种棋感。当然知道了那步棋之后也会经过很长的验算的,那就看你的时限了。如果时间长了,你能验算更多;时间短,就只能少验算。如果发现这一个点不行,再换另外一个点。这就是棋感吧。因为棋盘上的点实在太多了,没有一个大致的方向,是算不过来的。果壳网:除了“棋感”,人类下棋还会受到情感因素的影响,会有好胜心,会紧张,AI不会。你觉得人的这个特点是好事还是坏事呢?柯洁:肯定是坏事。我觉得程序强于人类很重要的一点就是不会受情感因素干扰。比如之前的梦百合杯决赛,我对李世乭的最后一局,官子时我出现了一个巨大的失误,差点被他逆转,至少我当时觉得被他逆转了,心里受了巨大的打击,就没有冷静下来;虽然最后还是赢了,拿了冠军,但我那时心态已经冷静不下来了,就觉得啊啊啊要被逆转了。情感因素肯定是人类的一大短板。如果人类能完全抛开情感因素下棋,不抱一丝杂念,应该是比有情感因素的情况下得好很多。梦百合杯决赛,柯洁对阵李世乭。图片来源:新浪体育而且人是会疲倦的,比如一局五个小时的棋,到了后来,人的专注度不可能像开始时那么高,坐久了也会累的,越到后来棋的质量下降得越快。但机器不会。机器只要通了电就行,就有源源不断的能量,人类会想吃东西,想休息。比如这五盘棋到了后面就能看出来,计算机在后半部分几乎没有失误,之前在大局上还有问题,后来就只能在细处看出一些问题。机器越到后来越强,人越到后来却会越疲倦、越脆弱。果壳网:你觉得AlphaGo将来会打败所有人类高手吗?需要多久呢?柯洁:(笑)因为我也不懂计算机,你能给我说一下阿法狗的计算方法吗?果壳网:围棋是不可能穷举的,它的做法是设法减少需要穷举的数量。正常情况下它有两套基本策略。一套策略是,先推算一步棋,如果发现局面太差,就不会把这盘棋推到底,直接把这一步抛弃了,这个比较简单;另一套策略是,如果走了一步棋,发现之后还有大量的选择,它就会从这些选择中随机地挑一部分,然后往下推下去,如果随机挑出来的这部分都不行,那就把这一步棋整个抛弃掉,不考虑这步棋的后续可能了。而具体实行这些策略的方式,则由机器学习来完成。柯洁:这是不是那个什么蒙特卡罗算法?果壳网:对,阿法狗的第二套策略就包含了这种方式。柯洁:所以说阿法狗只能算其中一些场景?果壳网:是的。柯洁:我觉得计算机要完全战胜人类,光知道这些是不行的。因为只算一部分的话,并不一定能算出最佳的一步棋。因此,如果还用这种算法的话,人类无论何时都有战胜它的希望,无论它有多强。程序只往后考虑了二十几手,并没有想出最好的一步棋,不一定完全正确。所以,就算计算机强大到了一定境界,把我的招学了,把李世乭的招也学了,学了个遍之后,如果只能推算那么多步,不能推算到最后的话,它一定还是会有失误的。所以我觉得机器在这方面还需要突破,必须每步棋都是最佳的,人类才完全没有可能战胜它。我觉得还是要保持一个乐观的态度(笑),未来十年不敢说,至少五年内,我们人类还是有希望的。我也特别希望人类能战胜计算机,因为作为棋手总不希望计算机比人类强;我学了这么多年,这么用功,结果他们随便一研究,把我们的招一学,就比我们厉害了,我们还是不希望的。但这一天肯定会来到的,我们也只能做好这个心理准备吧。阿法狗的确非常厉害,之前的机器连让五子也赢不了我们,在高手之间,多下一手棋就不可能有机会了。所以还是得相信科技啊(笑)。果壳网: 如果有一天,AI到了远远超出人的水平的地步,你还会继续下围棋吗?柯洁:如果对这个项目足够热爱,有热情,那计算机战胜人类也没有关系,只要下得开心就行。国际象棋二十年前就被破解了,但大家还是下得特别开心。我觉得围棋也不会受什么影响。太阳还是会照常升起的(笑)。我们肯定不会因为被计算机打败就不下棋了。更多可能是给那些刚入门的棋童一些帮助吧,让他们直接和比人类强的计算机训练,就省去了很多步骤。以后如果想学围棋就更容易,只要跟着电脑练就行了。我唯一担心的是,如果大家特别想赢棋,又知道电脑很厉害,可能会用机器作弊啊什么的。象棋和国际象棋经常会有作弊的情况发生,围棋也会有,比赛时会要求关掉通讯设备。但其实之前有通讯设备也没有任何作用的,反正机器也下不过人类。以后赛场可能还是得干扰一下通讯设备。我觉得机器应该不会对围棋界产生很大的影响,至少现在不会,现在机器到底能不能完全战胜人类还不清楚,但是我知道有一天机器肯定会,只是个时间长短问题。说不定有一天人类就被计算机统治了,可能也是个时间长短的问题(笑)。人类越来越科技化,以后的事谁也说不清楚;但我觉得我对围棋的热情是不会改变的,如果机器下赢了我,我还想赢回来。(编辑:Stellasun)一个AI 哼!科学人ID:scientific_guokr科研最新进展,学术最新动态,顶级学者的思考和见解。请关注 果壳科学人本文来自果壳网,谢绝转载如有需要请联系
觉得不错,分享给更多人看到
果壳网 最新文章:
查看更多&&>>&&
果壳网()是开放、多元的泛科技兴趣社区。
果壳网 微信二维码
分享这篇文章
1月30日 22:32}

我要回帖

更多关于 与电脑对弈围棋 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信