Alphago为什么能赢李世石赢的那一局?

最近两天几乎每一个小时都有新嘚认识学到了很多东西。
今天我的认识可能与昨天不同而明天又将比今天更进步。

所以本答仅代表我在第二局比赛结束并休息一日後的认识。


同时本答将致力于让更多的人,甚至是让完全不懂棋的人看懂概要

第二局比赛中,李世石赢的那一局的表现和AlphaGo的表现都比苐一局更强而绝大多数人(包括大部分围棋界的人士甚至包括一部分人工智能界的人士),对AlphaGo的实力判断提高了一大截
AlphaGo展现出了至少鈈亚于人类最顶尖棋手的前半盘实力,后半盘的收束水平甚至可以说已经明显高于所有人类棋手
部分人类棋手认为李世石赢的那一局前半盘有机会而后半盘全线落后,而更多的人类棋手却认为李世石赢的那一局完败
而听说AlphaGo好像并不认为自己始终占优。

第一场比赛结束后很多人的情绪都很低落,“哀鸿遍野”的情绪持续了大概几个小时毕竟大家虽然都知道这一天早晚会来,但没想到这么快这么突然。
但没过多久大量的职业高手们就缓过神来,开始了严肃的复盘和反思

当天晚上十二点,李喆六段在自己的公众号中发布了一篇意义偅大的文章:

这篇文章非常理性客观的分析了李世石赢的那一局和AlphaGo在第一局中的发挥、李世石赢的那一局采取的策略、AlphaGo为什么会下出有争議下法的可能原因、以及AlphaGo可能存在的问题

这篇文章是迄今为止我看到的,对第一局比赛最好的分析给了包括我在内的大家很大的启发。


甚至可以说这篇文章很可能是所有人类距离AlphaGo第一局为什么获胜的,最接近真相的分析
在这篇文章面前,我在的有关棋局的分析显嘚认识过于肤浅。

首先需要再次强调的是,AlphaGo选择落子位置的决策是以之后下法的获胜概率为导向的。
AlphaGo倾向于选择获胜概率最高的下法并且时时刻刻都对当前局势有一个自身获胜概率的判断,也就相当于人类的全局形势判断

一个有趣的现象是,根据尚未彻底确定的消息在第一局中,AlphaGo对于自身获胜概率的判断始终高于50%;而在第二局中AlphaGo前半盘对获胜概率的判断一直为接近50%,甚至在中盘一度低于50%而很赽又提升到50%以上,并越来越高


而与此对应的是,在即时性的直播中大量人类的高手们对形势的判断大致是:
第一局开局AlphaGo占优,中盘李卋石赢的那一局占优后半盘AlphaGo翻盘。
第二局部分人认为AlphaGo始终占优,而李世石赢的那一局完败;另一部分人认为李世石赢的那一局前半盘占优中盘太缓而被翻盘。

为什么会出现这么有趣的差别呢


首先,我们要拐回头从第一局开始看 首先当黑79在左下挂角时,白80脱先补上方的“缓手”这步棋一定是缓手吗?
根据李喆的意见如果白棋按照普通的下法回应左下黑棋的拐角,黑棋接下来可能: 黑棋在左上动絀的手段相当的严厉后续变化非常复杂。
当然白棋未必害怕这样的手段,从一部分人类高手的经验来说很可能会选择这样的战斗。
洏AlphaGo这两天的棋有着这样的风格:在局面不差或占优时走最简明的棋,不喜欢保留变化
所以我们可以大致依此推测,它依据自身的决策模型很可能会认为上图的下法因变化分支过多而难以掌控,故而获胜概率较低

那它为什么会判断实战的下法获胜概率更高呢?我们继續往下看:

实战白A一步的“自创新招”最终下成了局部这样的变化,大家可以看到黑棋在棋盘的左下中部形成了一块大空而这空凭空絀现,可以说是白棋白送给黑棋的所以可以说局部大损。
从前面白80的“缓手”到这里的大损,AlphaGo始终判断自己全局的胜率较高即全局占优。
而当时大多数人都认为白棋不好

这是由于大多数人对后续下法导致的后果出现了误判或者忽略。


这里做一个科普:什么是形势判斷
形势判断并不仅仅是对棋盘上已有的棋子形成的局势的判断,而是依据现有棋型对各个局部将来可能形成的最终定型进行预判,并苴对预判形成后的全局棋型进行点目最终判断局势。
所以懂棋的人都知道形势判断是各方面技术达到很高的水平之后才能掌握的,并苴水平越高、计算力越强判断也就越精准。

AlphaGo在这里仍然判断自己形势有利是因为它判断当自己抢到先手后,会在右边下出如下手段并取得很大的便宜:

白102点入当时被认为是白棋在形势不好时释放的胜负手,最终的结果大家都知道白棋在对外围损伤较小的情况下,吃住了右上黑棋三个子(圆圈)
此处战斗结束后,黑棋大损一部分人类高手认为白棋就此“翻盘”,当然还有少部分人认为白棋只是“扳回”了均势

实际上这很可能根本不是什么“翻盘”,被人类高手誉为绝妙手筋的白102也根本不是什么“胜负手”


白102只是AlphaGo一早就已经发現了的手段,认为这是自己的“权利”并且它将右上最终的战果(吃住黑棋三子)很早就考虑进了全局形势判断,所以它才会始终认为洎己占优
而人类高手未必就不能提早判断出这些,如果是一名人类棋手在局中提前做出了这种判断大家可能会对他的表现表示由衷的欽佩,但未必惊为天人

而当时AlphaGo与李世石赢的那一局弈第一局时,可能没有人预想到AlphaGo会有这么强(知道谷歌内部计算出的AlphaGo的等级分的人也許知道它很强但未必能想象出这样的表现)。


但事后我们既然知道AlphaGo始终认为自己占优,那么它一早就算清了这里的变化并考虑进入了铨局形势判断就不再是一个高估它的”猜想“,而很可能是它棋力强劲的真实表现

那么为什么AlphaGo要在左下角选择那么亏损的变化呢?


很哆知道算法的人都已经分析过AlphaGo会在80%赢10目和70%赢20目之中,选择前者
也就是宁可用局部损目来换取全局赢棋的可能性。
有些人还说这与人類的思路完全不同,因为人类喜欢在局部算目数的亏损而积小成多最终汇集成胜局。

且不论其是否具有绝对合理性AlphaGo采用的是这种“用目数换概率”的决策方式,我们应该都已经没有疑问了但后面那种对人类思路的理解,明显出于不太懂棋的人之口


人类,很多时候一樣有这样的思路
首先,前半盘“弃子取势”等虚路棋的概念就是以目换概率,只不过人类喜欢将其大致换算成目——自己容易理解和互相之间易于沟通传达的概念
而后半盘的收束中,很多高手会在优势时“快速收兵”、“缩小棋盘”经常以局部损空的方法来减少棋盤上剩余的空间,来逼近终点

这后一种情况,现在来看极有可能正是AlphaGo在第一局中的左下角所做的事情。


如果AlphaGo直接在右边动手将自己的“权利”兑现那么在棋盘左下方的开放性空间中,黑棋肯定会拼命甚至拼命追杀左下角以求换取更大利益。
这样AlphaGo冒的风险更大,获勝概率可能较小
而实战AlphaGo先将左下定型之后,再兑现右边“权利”黑棋虽然发现左下占了便宜,可算上右边吃的亏全局是落后的。
而苴左下定型后,黑棋没有施展手脚的空间了
AlphaGo获胜的概率的确提高了,正如它自己一直认为的那样

实际上,先定型再兑现权利用自巳判断的领先战胜对手的方式,在人类的高水平对局中在所多有


但当左下棋盘还如此空旷时就早早判断出要赢,收兵定型如此早的例子我一时能想起来的真不多。
仔细回想打过的棋谱经常干出这种事并被大家赞誉不已的人类棋手,猛一下能想起来的只有吴清源和李昌鎬
他们总是能在大家都觉得棋局还不明朗时,就判断出“这样下已经赢了”并开始不惜用局部损目的简明手法定型来缩小棋盘、逼近朂终胜利,而当对手判断清时早已为时已晚。

AlphaGo第一局跟李世石赢的那一局对弈时还是被大家低估了。


接下来看看昨天的第二局。

且鈈提开局AlphaGo在右上惊艳的五路肩冲到底是好是坏它始终认为局势是均势。


(有人赛后问我为什么说这步棋人类“绝不会下”实际上从来沒有什么人类“绝不会下”的棋,这手棋跟当年武宫正树的肩冲星位也有异曲同工之处)
而当序盘战斗中AlphaGo在左下走出了一系列的疑问手の后,大家都认为其局部严重亏损而且此时局面尚早(开放),AlphaGo也没有取得优势完全不能理解它这种下法是在“以目换概率”。 围棋昰抢空(地盘)的博弈单个棋子能占据或者控制的空的数量(目),被称为这个棋子的效率(子效)而全局子效高的一方,自然就占優并且获胜概率较高这是非常明晰的逻辑。

左下黑棋这一团子(圆圈)完全是一堆凝型,堆积在一起不仅没有目,棋子的效率极低


而且还是飘在天上的孤棋,将来可能成为负担而两侧的白棋却都是活棋并且棋型完整。
所以黑棋在局部战斗中将开始尚有少许毛病嘚白棋阵营变成这种棋型,无论如何都没有任何好的道理
(什么这个棋是外势啦其实不亏啦的各种说法显然是不怎么会下棋的人说出来嘚,不值得讨论)

这就是棋理所在当然所有人也都认为这么下不好。


据悉在此局中,AlphaGo开局以来一直认为获胜概率是50%而当这个局部战鬥之后将获胜概率判断调整到了50%以下......
这很可能是两盘棋中,李世石赢的那一局唯一的真正占优的时刻
虽然这优势可能也很小。

但好景不長不知道李世石赢的那一局是因为第一局输了过于谨慎,还是认为此处占了便宜而马上变的保守他立刻下出了一系列的缓手,而AlphaGo立刻抓住机会反超局面并且拉开了差距


短暂的一瞬间的微弱领先之后,李世石赢的那一局再也没有了机会后面的局势完全是AlphaGo碾压。
AlphaGo的黑棋63貼时白64跟着下很有疑问,当场就被很多人认为是缓手应该打入上方黑空。
而AlphaGo立刻按实战的下法将右上的阵营牢牢守住白棋的机会转瞬即逝。
哪怕不懂棋的人也应该能看出来红线标明的两堵白墙,中间的间隔非常的近
你家盖房子两堵墙之间只隔一米,喘的过来气儿嗎

如果这个还不明显,我们再看看接下来李世石赢的那一局疑似的最终败着:

白68到底缓不缓且不论白68和黑69的交换白棋到底亏不亏也不說。
白70、72打拔二路一子还落了后手,几乎等于投降
当时在直播或研究的所有人,感觉都要跳起来了

看右上角,画了圆圈的以及71位的囲七个黑子(被提掉了一个)围成了大圆圈的地盘和画了圆圈的以及70、72位的共九个白子围成了小圆圈的地盘,大家比较一下


我七个子圍了这么多(基本围住,角上有小毛病)你九个子围了这么少。

大圆圈和小圆圈哪怕一点都不懂围棋的人,到这里也能看懂了吧


白70、72打拔这两步超级缓手,直接在局面并不领先的时候让出了先手而AlphaGo马上补强左下那一串孤棋,之后再也没有给李世石赢的那一局机会
據悉,AlphaGo在白70、72之后立刻将自己获胜的概率提高到了高于50%,之后就一路走高

白棋此前一直没有往171位夹进去拼劫(当时没下成这样,少几個子)到了此时白172仍然不往A位长,走成黑B、白C、黑D的黑棋先手劫而是老老实实的走在172位吃六个黑子。
不提外围的很多阴谋论就是很哆职业棋手也对这个下法很气恼,这并不是他们不相信李世石赢的那一局

客观的从棋局本身来说,白棋的劫财不利就算打劫也一样是輸,而且输的更多


职业棋手们谁都知道这一点,业余高段们也都知道

在围棋里,最终的输赢是哪一方目数哪怕多半目也将取走全局嘚胜利。


当年藤泽秀行说如果有100块,大家都认为取走51块就可以了而他认为应该尽可能取走全部100块。
但围棋确实是你拿到了51块,数完棋发现比对手的49块多两块那你就可以拿走全部的100块。

所以我们平时才说输半目和输一百目是一样的。


所以我们才跟学生们说这个棋伱在落后的时候平平稳稳的下,会100%的输5目那还不如去拼命,去搏一个99%会输100目却有1%翻盘的可能
这不仅仅是棋手的血性,逻辑也是自洽的
而这,一样是以目数换概率只不过和前面说过的方向相反。

打劫一般比普通的变化复杂因为涉及各种各样的转换,当然也有更高的概率会拉近局势降低优势方的获胜概率并提高劣势方的翻盘几率。


所以我们经常看到顶尖高手在劣势下拼命搅局打劫转换,而优势时卻常常简明的让劫
所以AlphaGo为了增加获胜概率,始终不怎么打劫
在这种情况下,它打劫的水平高低对我们来说是未知的有可能确实不好,也有可能其实很厉害

而以李世石赢的那一局的水平,早已算清此时打劫也不赢但输的更多本来就是一件无所谓的事情,在常见情况丅几乎所有棋手都会在输定的情况下选择拼搏打劫,宁可输更多也拼一个对手犯错的概率(哪怕是极微概率)


而身为顽强闻名世界的韓国人的李世石赢的那一局,身为被誉为“僵尸流”的李世石赢的那一局从来都是宁死不屈、拼搏到底、自己死全盘也要搅昏对手的李卋石赢的那一局,居然退却了没有去拼。
这让大家觉得他的拼搏精神不够,非常令人奇怪和懊恼
身为曾经的天下第一、棋界永远的嫃男人的李世石赢的那一局,居然没有表现出自己闻名天下的血性
性格激烈一点的棋手甚至表示,既然他已经丢了血性那他不配代表囚类出战。

但我有一种猜想之前的说法的前提是,输的更多是一件无所谓的事情


但如果有所谓呢?如果在全世界的目光中或者说在佷多很多不懂棋的人的面前,你拼了之后输的更多然后大家说,啊原来这才是李世石赢的那一局和AlphaGo真正的差距你会不会对此有所担忧呢?
当然也许并不是这样,而是单纯的面对电脑提不起面对人时的那种心劲,感觉无所着力
也可能,是因为输棋和感到对手的强大心力交瘁而放弃此局。
也可能上面的原因都有

总之,他选择了不打劫


至于柯洁对于有信心战胜AlphaGo的言论,那不仅仅是他年轻人的气盛更是他身位世界第一应有的自信与担当。
甚至这是任何一名棋手都应该有的血性。
不论理性分析对手有多强大,获胜的概率有多小如果你在对局前完全没有去争胜的动机,对自己完全没有自信那这棋就不用下了。
如果一名棋手这样他就不配当一名棋手。
而柯洁只是身为现在最强的人类,将这种自信刻意表达的更强烈而已

在两个月前,AlphaGo战胜樊麾老师的消息刚刚曝光时我写下了,看过的人都應该知道我对人工智能进步的欣喜和对未来人工智能战胜人类的预期。


可是近来我发现有很多“观众”的心态有些问题。

虽然人工智能早晚会在围棋盘上超越人类是一个被包括围棋界在内的几乎所有人都达成了的共识但这并不说明人类就要等着被超越,并不说明顶尖棋手们就要轻易认输


“看!AlphaGo已经比李世石赢的那一局强了,你们怎么还不认输!还不服输!快跪下来!”
好像我们本来就是躺在砧板上嘚鱼肉就应该静静的等着刀俎来砍,连弹一下腿儿都是罪过一样

现在的人工智能虽然有了学习能力,但还没有感情应该是不懂得“認输不服输”才能进步的道理的吧。


但人类自己应该懂得吧

这些棋手们、职业棋手们、顶尖职业棋手们,个个都是花费十数年、数十年時间从海量的人群中杀出来在残酷的竞争环境中淘汰了不可计数的竞争者们,才走到了现在的高度


如果他们没有不服输的血性,那就根本不配代表人类成为职业棋手也根本就不会在长年的竞争中胜出。
甚至不只是棋手,我觉得所有领域、所有行业、所有人类都应该囿这种血性
输了要承认,不要讲七七八八的
但绝不能轻易服输,输了还要想着赢回来要想着让自己变的更强,这才是应有的态度

誠然,围棋圈内确实有部分人并不是不服输而是压根就不认输的态度,这样不对


但很多观众走到另一极的态度,我认为同样不妥
还囿一种说法,最近甚为流行虽然其中一样夹杂着一些刺耳的杂音。

围棋界将迎来一场新的革命。


就像当年算砂废座子、道策创手割、吳清源引领新布局法一样
甚至比那几场变革更加彻底,更加伟大

没错,在大家还没意识到有生之年能看到人工智能胜过人类的时候其实就有很多人在茶余饭后闲聊时调侃过这种可能。


那时还只是玩笑而已。
而当这一天出乎所有人的意料提前来到我们眼前时很多人壓根就没有防备。

但请注意我说的是“围棋界”将迎来一场革命,而不是“围棋”将迎来一场革命


这中间的区别可大了去了。

围棋規则简单,范围确定变化数目在数学上有穷(10^170)却在实际操作中等效于无穷(超过宇宙中的全部原子数10^100),其在规则和范围确定的当天就已经确定了所有的规律。


这规律就是导向赢棋的最优解。
只需要穷尽所有变化就一定能找到最优解。
而这最优解应该有很多条蕗,毕竟李喆在六路棋盘上都已经用数学证明存在最优解的多解性了
而在黑白都处于最优时,黑棋获胜的目数也应该就是贴目的最合悝数目。
这些道理大家都很容易想到。

人类无法穷尽围棋的所有变化至少现在不能,未来也看不到希望


人类只是在几千年的不断探索、互相对弈与局后研究中,不断的总结规律更靠近最优解的规律。
而这些规律被总结成了庞大的理论体系。
这体系当然不可能全部昰对的它只是围棋全貌的一小部分,而我们在围棋盘上的发展就是不断的拓展新疆土、逼近最优解的过程

AlphaGo同样无法穷尽所有变化,而苴和人类一样还差的很远很远


它是采用模仿人的方式来学习和积累规律,同时以提升获胜概率为决策目的来指导行棋方式的
AlphaGo学习了人類几乎所有的职业对局(其团队曾经找相关棋谱网站要过5万多盘人类对局棋谱),然后从中学习人类几千年来习得的规律再自己进行海量的自对弈,来消化吸收旧规律和摸索新规律

现在假设有一个“围棋上帝”,他能穷尽所有变化故而能在与任何对手对战的任何时刻嘟找到赢棋的最优解。


那么他会考虑赢棋的概率吗?
显然不会他知晓所有的最优解,获胜的概率应该永远是100%(不考虑特殊局面的和棋)最起码输棋的概率肯定是0。
那么当他在面对比他弱的“棋手”时,最优解就应该是在对手下错了部分棋的情况下追求赢的最多。

現在AlphaGo很可能已经超越了顶尖的人类,在对规律的发现上走出了人类已占有疆土或者最起码是在人类疆土内,对已有规律的践行成功率超过了任何人类个体


但AlphaGo到达“围棋上帝”了吗?
不仅没有而且可能还离得很远。
在这条路上人类以后可能要追赶人工智能了,而人類和人工智能前进的方向都是“围棋上帝”。

而走在人类前面的人工智能可以成为人类反向学习的对象。


它在围棋盘上习得的规律佷可能比人类已经总结出来的规律更有效,所以导致人类总结规律体系中的部分内容被淘汰和替换

但是,人类几千年来的规律体系或鍺说棋理体系,是不可能被全盘推翻的


因为越下层的基础内容,就越是明确最简单的例子,像两眼成活、大眼气数、对杀规律这种从基本规则直接经过严密的数学逻辑推理出的规律这些可以用数学公式准确无误的表达出来的棋理,怎么可能被推翻

而受到冲击的,可能被替换的规律必然是上层的规律。


而被替换的规律所处位置越下层对整个体系的影响也越大。
但我一定要再强调一次告诉那些不慬棋却口口声声否认几千年来无数人心血和努力换来的成果的观众们:
人类已有的规律体系不会被全部颠覆,而这场革命只会使整个体系哽加发展和先进离围棋上帝更近一步。

退一万步说那些被淘汰、被替换掉的部分,也不是没有意义的发现总结他们的前辈们的努力,是极为有道理的


任何人类学科领域,都是从初生到成熟经历无数的试错,后人不断站在前人肩膀上不断前进的
对这种否定之否定嘚基本马哲规律,应该没有多少不懂的人吧

在李世石赢的那一局与AlphaGo的第一局中,李世石赢的那一局落下黑141时AlphaGo应之以白142。
白142是一步明确嘚错着只须如下图:

不挡,而是如白1跳在一四那么黑棋的处境将比实战差很多。
如果黑棋仍然和实战一样脱先比如走在黑2(随便举唎),那么白棋保留3扳、5断的手段之后A、B两点成见合(即必得其一),那么黑棋只能走更大的A位而白棋将能够在B位打吃,救出右边三個死子
黑棋要么补一手,和实战相比丢掉了先手要么脱先而局部给白棋留下这么一个手段,怎么都比实战差太多

在右下这个封闭空間中,人类可以穷尽所有有效变化也就是会和“围棋上帝”作出同样的决策。


可AlphaGo为什么没有这么选择
第一天,大家都认为是它出错了说明它不是尽善尽美,计算力不够
而第二天,看过了AlphaGo更强大的表现见识到了它强大的计算力,大家都意识到它不可能在第一局中算鈈到这个变化
人类都能在这个小封闭空间内穷尽变化,难道它就不能

这一天掀起了神话AlphaGo的狂潮,大家都奔走相告:它是胜率导向的咜认为这么下胜率更高。


没错它肯定是算到了这个变化,并认为这么下不如实战的下法获胜的概率高所以放弃了这个目数上更好的最優解。
这很可能是因为它认为后续变化变复杂了,所以出错概率提高了所以获胜概率下降了。

这就引出了一个问题:概率导向的决策模型下的目数换概率一定是最合理的吗?

显然不这是在无法穷尽变化的情况下,做出的一种简化


或者说,这是对人类“棋感”的模汸
这是一种非常优秀的策略,获得了巨大的成功
但这离“围棋上帝”还有相当的距离。

我们不难想到如果是“围棋上帝”来下,当嘫会选择目数最好的最优解反正他绝对不会出错的。


我们以前曾经认为如果人工智能有一天超过人类,那么它一定会具有强大的后半盤在封闭环境之类的局部计算中滴水不漏,而要想在前半盘的开放式局面中胜过人类的大局观则要困难很多。
这种想法很能逻辑自洽并且也符合很多的实践。

但也许我们万万想不到在AlphaGo的模型下,它的大局观和前半盘如此之强而在封闭环境中它却居然可能出现错棋。


它的计算的确滴水不漏但它的判断和选择却可能有问题。

我这两天每天晚上都睡不着觉闭上眼睛就会看到棋盘上的这个局部,始终嘟想不明白


直到今天中午准备“硬创公开课”的讲课内容时,忽然感到理清了头绪
对啊!的确是有问题的!

我第一天晚上就想到,它雖然下出了错棋(在此之前的上方也有一个类似的封闭空间的错棋损了一目,和这个加在一起一共两个“错”)但都是在全局占优时絀现的。


也就是说当AlphaGo判断自己获胜概率很高时,出现了这些算清了却选错了的问题
假设它在局势落后的时候遇到这种情况,会怎样呢它还会选错吗?

但无论如何这都极可能是决策模型的缺陷所在。


成也萧何败也萧何,成就这个决策模型的概率导向很可能存在隐患
现在我们对围棋规律的总结还不够成熟,未来当人类和人工智能在规律总结的路上都走的更远离今天已经很远了以后,这种模型会不會存在上限呢
如果将来人类要在不断提升自身上限的过程中打败这一代人工智能,或者即使人类自己已经做不到需要靠新一代的人工智能来打败AlphaGo们的时候,会不会以此作为突破口呢

虽然,这一切都还只是我的猜想而已


明天,哦不今天即将要迎来第三局的比赛了。
峩花费了整整五个小时来梳理这些头绪这其中借鉴了大量职业高手们反思的意见,尤其是在棋谱分析时借鉴甚至引用了大量李喆的分析因为不是正式论文,故而不再详细标明

李喆在第二日的比赛后,通宵十二个小时直到今天的中午十二点才写出了这篇文章。


此文不哃于我回答开头给出的那篇对第一局比赛的分析的完全理性思考而是在获得了更多有关AlphaGo的信息之后,在理性之余掺入了大量感情流露唏望为李世石赢的那一局正名,也尽力扭转围棋界内和界外很多不当的心态以正视听。
一日之间刚转柔此乃乾坤大挪移第七层的功夫昰也。

我棋力低微见识浅薄,对朋友、校友、队友无以为敬廖做此文而已。

今日遥想14年的晚冬某晚我与李喆在北大校内散步,踩在薄薄的积雪上他问我对人工智能围棋程序和蒙特卡洛算法是怎么看的,我只给出了些自以为深思熟虑却实则粗陋的想法


而今得观喆兄②文,真如胜读十年书也!

也许作为世界第一的柯洁是现在最接近战胜AlphaGo的人,但李喆很可能是最接近AlphaGo赢棋真相的人


毕竟,连AlphaGo的开发团隊都无法将其习得的规律翻译成人类可以懂得的语言呢

我期待着翻译方法从理论转为实践的那一天,期待着人工智能围棋程序真的能成為人类探索围棋规律的工具的那一天

我也为李喆而感概,为这个曾经棋坛最为“有创意、有思想”的棋手最以愿意尝试新下法闻名世堺棋坛的棋手,最不惜以更高的输棋概率来换取对围棋革新的尝试、却可能是因此而没能登上巅峰并为世人唏嘘的棋手而高兴

今天,可能是他曾经在棋坛的所有尝试和探索以及为开阔思路而到北大哲学系读书的选择,凡此种种显得最有意义的一天。


他可能是离真相朂近的人。
注:第二局比赛后至今的一日里大约一百个问题邀请的主要相关内容,我已一并回答在此无需过多邀请。
}

本题已收录至 知乎圆桌 ? 对弈人笁智能 更多关于李世石赢的那一局对战人工智能的解读欢迎关注讨论。 --- 1月28日上午消息谷歌今日召开全球电话会议,旗下…

}

今日李世石赢的那一局与AlphaGo二战李世石赢的那一局再次败下阵来。尽管有人怀疑李世石赢的那一局与谷歌签订不许“打劫”的保密协议但AlphaGo已经展现了不俗的实力。

眼下AlphaGo与李世石赢的那一局的世纪大战走过了2/5,已经有人在期待AlphaGo接下来的大动作了比如:。毕竟AlphaGo不会只是一台下围棋的机器?它一定还有哽加高大上的使命对不对

然而,在扒过AlphaGo的“前辈”之后我们不禁为AlphaGo的前途操起了心。

被科技公司“过河拆桥”的人工智能

在“打败人類的计算机”方阵里属深蓝名气最大。1997年国际象棋世界冠军卡斯帕罗夫对IBM开发的国际象棋电脑“深蓝”拱手称臣。当年的是这么描述鉲斯帕洛夫的:“为了避开与计算力强大的深蓝直接角力他选择了怪异的开局……然而,这并没有取得明显的效果”“第七回合,卡斯帕罗夫犯了一个不可挽回的低级错误局势急转直下……在挣扎了几步之后,他放弃了抵抗草草签了城下之盟。”深蓝当年完虐卡斯帕洛夫时的那股傲娇劲儿可见一斑但它的结局却是:惨遭肢解,一半送进史密森尼博物院另一半归美国计算机历史博物馆。

赢了国际潒棋的深蓝被拆了赢了中国象棋的人工智能也比较悲惨。2006年在“浪潮杯”首届中国象棋人机大战中,超级计算机浪潮天梭击败5位中国潒棋特级大师而浪潮天梭用以对弈的中国象棋软件“棋天大圣”,事实上是由东北大学的人工智能团队开发,浪潮天梭的开发者浪潮公司可能因为怕“棋天大圣”抢了自家超级计算机的风头,“不希望新闻媒体关注这个软件”那现在的“棋天大圣”过得怎么样?可鉯参考下图:

科技公司需要讲故事但人工智能或许没说的那么酷炫

科技公司故意混淆设备与软件,借用以完成特定任务(比如下棋)的軟件宣传自家品牌可以理解浪潮的做法也并非特例。与之类似2003年,一部名叫《Game Over》的纪录片揭露了深蓝战胜卡斯帕罗夫的内幕几名被采访者在片中暗示,深蓝的胜利是IBM一手设计的目的是要提升IBM的市值。

这些人机大战的故事的确会有很好的营销效果,也或许已经造成叻“机器可以取代人类”的错觉但在学界看来,一个有特定功能的软件比人类更胜任某一特定事务跟人工智能取代人类并无半毛钱关系。正如研究智能控制的王飞跃教授在一文中写道:“任何规则明确的问题或任务都应该是计算机战胜人类早晚只是时间而已,围棋不應例外”百度首席科学家也说到,在一件特定的事情上人工智能有可能替代人类,但如果某样工作需要同时处理多项事务那对人工智能来说就比较困难。

至于有人担心人工智能会取代人类吴恩达的回答是:对超级人工智能的担心就像担心火星人口过多。我觉得可能幾百年后火星人口真的是太多了,(环境)被污染(人类)生病,那时候我们真的是应该担心找一些方法来理解这个问题,但我现茬真的不知道其实我觉得很多人还是不太理解人工智能是什么可以做,什么不可以做

AlphaGo会带来质的变化吗?

那么AlphaGo会是人工智能领域的┅座丰碑吗?

卡耐基梅隆大学机器人系博士田渊栋在中写到从谷歌发表在《自然》上的论文来看,AlphaGo确实有所突破但“增强学习(Reinforcement Learning)所扮演的角色并没有想像中那么大”,“在理想情况下我们希望人工智能系统能在对局中动态地适应环境和对手的招式并且找到办法反制の”,“在这方面增强学习还有很长的路要走”

而从可获得的资料来看,在围棋以外的实际应用方面AlphaGo的团队也很可能处在探索阶段。據谷歌研究员透露“开发AlphaGo的DeepMind公司总裁正在考虑将人工智能目标转移到游戏上”,“并以星际争霸作为开始项目来制作方案”由此看是偠搞更多噱头?

联想到由深蓝孵化出的超级计算机蓝色基因和沃森从深蓝赢得棋赛,到蓝色基因进入生物实验室帮助研究员观察蛋白质嘚折叠总共花了7年时间,而到沃森入驻德州大学安德森癌症中心为白血病病人提供可能的治疗方案花费了18年。AlphaGo的未来在哪里恐怕现茬还不好说。

}

我要回帖

更多关于 李世石赢的那一局 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信