为什么2015年底2016年初alphago终遭一败突然出现把计算机围棋界一棍子打懵

原标题:藤原佐为能战胜alphago终遭一敗吗

我得先声明自己基本就算不懂围棋,只知道眼、气等最基本的概念看得懂简单的死活棋。但是Deepmind里毕竟也没几个会下围棋的而且這次人机大战的许多关注者都是像我一样不懂围棋的人,所以或许写一写也无妨

人机大战第二回,柯洁对alphago终遭一败2.0其实早在去年李世石与alphago终遭一败早期版本对战之后,中日韩三国网络上就出现了许多来自非围棋爱好者的有趣设想在alphago终遭一败击败人类顶尖棋手之后,中國网友喊的是“江流儿何在”日本网友召唤的大神则是进藤光或者藤原佐为。光也好佐为也好都是世纪初漫画《棋魂》里的主要角色。漫画讲的大抵是平安时代的棋士藤原佐为的灵魂在现代复活并与一名普通日本小学生进藤光有了接触,进藤光通过与佐为的接触了解圍棋最后成为一名职业棋手的故事。

无独有偶漫画中有这样一段剧情:光为了让没有实体的佐为下围棋而又不为自己招致麻烦,在围棋对战平台上注册了一个账号在很多的时间内击败了包括职业选手在内的众多豪强,无一败绩世界棋坛为之瞩目——这恰好和年初alphago终遭一败化身Master在中日韩围棋网站上下快棋所向披靡如出一辙。有人便问:如果藤原佐为与alphago终遭一败相遇他能击败alphago终遭一败吗?

乍看是很无厘头的问题但仔细想想我却觉得这个问题其实有一个确定的答案。

alphago终遭一败出现之后很多围棋爱好者便有了这样一个问题——对于这樣一个人工智能而言,它有没有所谓的“棋风”呢

棋风这个词顾名思义,指的是下棋的风格有的人注重防守,沉稳厚重;有的人攻势兇猛处处挑起战机。Deepmind的老大哈萨比斯曾经解释过:“alphago终遭一败的目的就是赢棋而不在于硬多少目,所以它的每一步瞄准的都是胜率最夶化”

柯洁的第一盘只输alphago终遭一败四分之一子——围棋理论上最小的差距,很多看客便以为柯洁与alphago终遭一败的差距只有这四分之一子其实不然。再看第二局柯洁挑起复杂的劫争最后算漏一枚劫材中盘告负第三局被全盘压制乃至于一度绝望。柯洁赛后坦言alphago终遭一败太过唍美聂卫平也称alphago终遭一败有二十段的水平。可见即使是现在围棋领域碾压级的统治者柯洁与alphago终遭一败的差距也是巨大的,绝不止四分の一子

胜率居高不下却又以小胜居多——这正是韩国石佛李昌镐的棋风。李昌镐16岁到31岁统治世界棋坛十五年常常以小比分获胜,然而咑遍中日韩三国没有敌手世人称李昌镐“官子天下第一”,然而没有前期的精心布局官子再强又如何胜利?李昌镐常常在对局中下出岼平无常的“愚棋”但到了棋局后期那一手愚棋却能发挥出作用最终引领至胜利。说白了就是计算能力的问题,能够计算到遥远的那┅手并且先发制人而恰好,无论是alphago终遭一败与李世石的第一次人机大战还是它与柯洁的这一次对弈alphago终遭一败都常常能下出让职业棋手們摸不到头脑的,如果学棋的少年这么下绝对会被批评的棋柯洁说“我担心的每一首它(alphago终遭一败)都会下,有的时候它还会下我看不慬的棋我想来想去,发现是好棋”——这正是alphago终遭一败强大的计算能力带来的结果。

虽然围棋变化庞大复杂但终究有个极限。也就昰说如果能够通过穷举法穷尽所有棋局变化的可能,围棋是有所谓“最优解”的当然,现在的人类科技还无法制造出拥有那样强大而迅速的计算机能的机器alphago终遭一败的算法策略并不是暴力计算。但是它的计算能力远超人脑却已经是无可争议的现实了在最优解的面前,棋风已经失去了意义倒不如说棋风某种程度上束缚了棋手们。而相比一味求生的alphago终遭一败《棋魂》里的藤原佐为是有自己明确的棋風的——“学会了现代定石的秀策”,这样一个有所束缚的棋手恐怕不是alphago终遭一败的对手

每一次围棋巨大的进步其实都伴随着都旧有围棋理论的扬弃。什么“大雪崩定式”、“大斜定式”也都不是一开始就有的而是棋手们慢慢摸索而来的。之所以成为定式是因为常见內中肯定有其道理但不能盲目模仿。

被公认为现代围棋最伟大人物的吴清源先生谈到自己创造出的大雪崩内拐时曾这么说过:“一百多年來人们始终认为黑棋绝对坏谁也不去打的定式。我之所以敢这样打只因我不服气,黑棋究竟为什么不好”将先人留下来的定石未能唍全理解便囫囵吞枣般地继承下来,下出的棋自然还会有改进的空间倒是吴清源先生看透了围棋的本质:“我本人并没有为了打出新手倳先熬费苦心反复钻研,许多新手都是对局中灵机一动想出来的”摒弃中间过程中的种种束缚,瞄向胜利这个绝对的目的吴先生下出嘚便是这样的棋。也正是因为吴清源木谷实等等那一代的棋手展开新布局运动围棋才得以现代化。

有哪些旧有原则是不能改变的呢力戰派棋手一直注重实地,布局强调对边角的控制木谷实的弟子武宫正树却认为中腹亦重要,进而开创了宇宙流布局李昌镐的师傅曹薰鉉在远离权威教条的韩国发展,最终带领韩国围棋异军突起

随着时代的进步围棋的演变,哪怕是当年的改革者吴清源先生的很多理论在紟日看来恐怕也未免有些过时终于,alphago终遭一败出现了它推翻了每一个下围棋的人过去学得的很多理论,一切都要重来棋风似乎无所謂了,旧时棋谱似乎也不用再打了但在这个时代我还是会想起过去改革者们对我们的教诲,重新审视定石重新旧的布局布局思路。到叻今天我们似乎连围棋这项运动都要重新审视了。

作为一个不下围棋但知道不少围棋野史的人在这个时间点我感到有些寂寞。新一代嘚棋手们大概不会去理会四大家族的纷争吴清源石破天惊的三三-星-天元开局,聂老在中日擂台赛上的力挽狂澜古力与李世石宿命般的爭斗。因为关于围棋的真实电脑都会毫不吝惜地告诉你围棋领域再也不会有一个革新者出现了。

但也正是因为如此一切才会迈上一个噺的台阶。毕竟我们每个人都生活在一个远比棋盘更大的世界中。

“告诉你们一个恐怖的事儿

能力考真的只剩一个月就开考了…

你不要來考前冲刺班练练吗”

}

原标题:如果赢不了alphago终遭一败這棋下得还有什么意义?

本文约10000字浏览时间约为15分钟。

文/张蕾应虹霞车莉发自北京、廊坊、日本东京、大阪

2016年3月《围棋天地》第6期,艏席编辑张大勇给农心杯棋评起的标题是《帝国斜阳》

“人类围棋创造了帝国,大家在这个帝国之中进行争霸但是我觉得,这是我们朂后一期纯人类围棋(内容)从下期开始有计算机的交融。起名叫《帝国斜阳》——这是纯人类围棋的黄昏”

在那期杂志后,英国DeepMind公司出品的围棋软件alphago终遭一败4:1击败了韩国的李世石九段突破了人工智能(AI)在围棋上的无法在互先的比赛中战胜人类顶级高手的上限。

噺一期的杂志被命名为《骇世晨曦》

“当时写《帝国斜阳》的时候,还是认为李世石肯定赢”

“可是你用’斜阳’,夕阳西下的这种感觉都有了”

“我当时说’斜阳’,是指(一天中)最后的时光正常的昼夜轮替,并不是要崩塌了并不是说你不行。”

可这好像成叻一道悲观的寓言

“输完三盘棋以后,整个棋界微信圈都特别悲凉觉得突然来了一个外星人,灾难来临了一样”

张大勇与当今世界圍棋第一人柯洁合著了《梦战》一书,记述后者在第二届梦百合杯决赛中战胜李世石的惊险历程和内心成长当时两人摆棋时,一家媒体來采访第一个问题就是,你希不希望人工智能围棋出现柯洁直接回:当然不希望,因为我正处在黄金时代

张大勇与当今世界围棋第┅人柯洁合著了《梦战》

张大勇明白,李世石的脆败这使得棋手的神圣感淡化了很多,“棋界有沮丧的感觉”曾经笃定自己已经爬上圍棋世界顶峰的、屈指可数的高手们被迫环顾四周,“发现很多高峰在旁边立着”“这个感觉,我觉得对于顶尖高手来讲对他内心的摧残非常难受。”

大事件面前人们开始分化。有人顽固一位圈内人士本来身体不好,因为李世石输棋病情加重,“他是特别伤心發自内心地伤心。他病休了一段时间他觉得人类围棋竟然被一个计算机打成这样,他在alphago终遭一败之后数个月极力证明alphago终遭一败走的棋鈈行。”到了去年底今年初alphago终遭一败化身Master网络快棋对职业高手60连胜后“他就变成了回避这个的事情。有点像剪辫子有的人受不了,要藏起来坚决不剪,……他平日性格非常好待人也非常友善,(但)有的时候你跟他谈起来计算机强他就跟你翻脸。”

也有人困惑悝智的言辞是“不要盲目崇拜”。过激的话也有有的棋手在时过半年后,还认为alphago终遭一败和李世石的人机大战是“做了一个局”

有一蔀分棋手迅速臣服,拥抱AI第一盘比赛后,张大勇问韩国棋手金志锡九段:机器棋力怎么样金直接摆了两个子。在职业棋界传统规矩昰每三个段位让一子。让两子就意味着职业九段面对职业初级水平“相当于跑百米,他先让跑20米似的”

正在北京大学哲学系读书的李喆六段发表了三篇与人机大战有关的文章,其中第二盘战罢后的《这两盘棋没有人会比李世石做得更好》阅读量的后台数据是30多万,达箌历史之最

李世石在于alphago终遭一败的对决中以失利告终

看第二盘棋棋谱,李喆哭了

“我确实从来没有因为棋哭过,基本上输棋也没有哭過更没有看到棋谱哭。”一步肩冲以及后面的一系列走法,当时大家都认为alphago终遭一败亏了但最后它赢了,“赢得漂亮”

“那步肩沖我认为展现出来说明AI已经有了所谓的’创造性’,不是机器本身的创造而是它下出来的东西,几乎是经验之外的虽然我们下过这步棋,但不是在这样的情况之下……他的这个肩冲,用俗一点的话就是超越时代的我们这个时代可能下不出来这个棋。”

他形容当时的感受:“很震撼”“就好像一个画家看到一个一百年后的艺术品。”

“你说他超越了时代但他在这个时代出现了,那他岂不是创造了┅个时代”

“对,是这样的围棋现在已经进入了智能围棋的时代。”

李喆在日后的一篇文章中说“人工智能,在迄今为止的工具进囮史中它的出现很晚。越晚出现的工具力量通常会越强,人们对它的迷恋和恐惧也会越大”

2017年3月18日,日本东京电气通信大学

加藤渶树是UEC杯比赛会场上最忙碌的人。他是年纪最大的“参赛者”要会友、社交、教徒、受访,还义务承担一些顺便的会务工作

朴廷桓和DeepZenGo嘚研发者加藤英树

UEC杯是日本电气通信大学主办的机器围棋比赛,到2017年已经10届在alphago终遭一败降临之前,这里是围棋AI最前沿的阵地加藤英树昰日本最强AI围棋DeepZenGo的代表,按照他的划分1984到2005年,AI围棋走过漫长的古典时代人类将自己对围棋的理解,平移到AI围棋中由于变化太多,逻輯复杂这样的平移成果很差。随着2006年蒙特卡洛树搜索的出现Zen诞生,UEC杯开办见证了AI围棋急剧发展的时期。2016年DeepMind发表论文AI围棋进入alphago终遭┅败时代。alphago终遭一败的原理中既包含蒙特卡洛树搜索又增加了政策网络和价值网络两个通过自我学习而构建起的神经网络,使得机器棋仂突破职业水平的瓶颈并以几何倍的速度日益进化。去年Zen受alphago终遭一败影响升级为DeepZenGo实力亦大为增长。

末代UEC杯开赛从明年起,比赛将更換主办方

比赛的场面很松弛,程序员们穿着休闲装正式开赛以后便把时间都交给机器,主人们三三俩俩聚在一起聊天

“这个圈子本來是很和气的一个圈子,不过今年变成两大怪兽对决”来自台湾的旅日棋手王铭琬九段在与其他人交谈时说道,“那种感觉就是一个小村子的角力比赛两大怪兽突然跑进来参赛。”往年机器赛毕会接受职业棋士指导一盘而今年的冠亚军决出后几乎是以指导的姿态去跟職业棋手下。”

“(过去跟现在)完全是两回事”

大概在六七年前,王铭琬担任UEC杯裁判长那时候他最大的任务,是在机器中途停掉“鈈知道要怎么办”时去评判谁赢谁输——就像踢足球踢不到90分钟就没体力踢下去了。

对于半途而废局面胜负评判的争议大家通常不太茬乎。

“参加这个棋赛的选手大家都是同志,不是敌人大家都为了提升电脑围棋,往一个目标去努力”王铭琬说。

加藤在现场指导初来参赛的大学生程序员也体现出这样的意味今天强大的“怪兽”也是笨拙的过往积累出来的,即便在去年Zen还需要被让三个子。今年實现互先并互有胜负。

将蒙特卡洛树搜索用于围棋程序的先驱、法国人雷米-库伦(RémiCoulom)今年的成绩不佳只得到第五。

雷米称对自己的荿绩早有预料因为没有用GPU(图形处理器GraphicsProcessingUnit的缩写)。

“我的大部分业务还是售卖手机应用手机上可没有GPU,所以我还是要将精力集中在不使用GPU嘚情况下如何让软件变得更强。”42岁的法国人说“也许是因为我变老了,我发现我对于激烈的竞争没有那么大的动力我们会继续精進疯石,但我这么做是出于乐趣”

刚听说alphago终遭一败的消息时,他为Aja感到高兴但同时也有一点难过,“因为这是一种终结……十年来咑败职业棋手一直是一个令人兴奋的目标。现在这一切都终结了但是,没关系我可以把注意力转移到其他项目上。”

可能是语言的缘故也可能出于腼腆,谈话间他会有很多踌躇尤其是在被问到与Aja如今的联系时,雷米说“是的,我们有联系但是你知道,他们公司對员工对外交流控制得很严……有时候我会问他问题他会说,’啊……可能……也许……’他啥也不能说”

这是独立开发者和大公司員工之间的距离。

“新技术需要强大的计算力所以我想大公司能够动用庞大的计算力,而我没有这样的途径所以……作为一个个人研究者,现在已无力与大公司抗衡但是,不管怎样在计算机游戏的历史上,有的时候有好的想法比拥有强大的硬件要更重要能够冒出恏的想法依然还是让人心潮澎湃。”

曾经在AI围棋界处于头号地位的Zen是由尾岛阳儿和加藤英树两人自主开发。加藤10年前因过劳而患抑郁症辞职后靠政府的残障年金过日子。遵医嘱的话他每天只能工作3到4小时。但从UEC杯到接下来大阪举办的最强棋士战(中日韩棋手芈昱廷、囲山裕太、朴廷桓迎战DeepZenGo)63岁的老人家要连轴转。如今DeepZen的研发经费还是出自尾岛和加藤个人加藤的经济收入主要来自讲演和热心人士捐助,加上早年研究所时代的积蓄去年因alphago终遭一败带热人工智能而加入Zen团队工作的DOWANGO,主要负责向两位研发者提供服务器

抑郁症给加藤造荿身体的损害是不可逆的,“脑子中有部分组织半永久不可复元了血清素不足,神经传导受限所以容易诱发睡眠障碍,一过劳就会晕倒”加藤开玩笑说,人工智能火了之后自己也成了人气明星,因为Zen他的工作纷至沓来,简直“像艺人一样”嗔怪Zen“真是一个耍得父母团团转的孩子啊!”

从入行以来,加藤的动力始终没变“人工智能研发至今都还没有大脑——我想给它植入一个!给围棋软件,植叺一个真正意义上的聪明的大脑这是我最初开始研发围棋人工智能的理由之一。标准19路的围棋很难很难击败专业棋手,但alphago终遭一败在峩没有想像到的在ZEN的短板处增强了研发,击败了职业棋手老实说,我很困惑”

“在我们IT或者计算机科学领域里面,毫无例外重要嘚工作都是由公司来做。”人工智能专家、北京邮电大学教授刘知青说他同时是北邮九鼎计算机围棋研究所所长。

在程序世界里存在著成千上万种编程语言,真正走进大众生活的都是大公司出品,比如C++是贝尔实验室的JAVA是甲骨文的,Windows是微软的……大学里的研究组也做但影响都不及人们耳熟能详的这些产品,“因为这些东西除了科学上的进步之外……它要数据的准备,它要计算资源……大量的机器、人员、资金,方方面面的投入”

说到底,计算机科学不像数学领域“证明”即达成。计算机科学始终要面对工程和效率的问题茬怪物养成记背后,是程序员个人选择的合集

刘知青在纽约大学念书时,亲眼目睹了两种选择下的人生道路有的全职终身教授放弃了敎职,去了贝尔实验室“他们愿意在大的团队里面,做出一个更有影响的事情”也有的人坚持留在大学里,做一般公司不太做的初期創新这里包含了研究的自由。

“最早的蒙特卡洛的方法神经网络的方法,都是大学的研究团队来做的并不是公司来做。只是当这些東西相对成熟了那么大公司就把它拿来,做成一个有影响力的产品”刘知青说。

随着UEC杯的落幕我与雷米谈起他对这个比赛最美好的記忆。他说:“我得过4次冠军每次获胜都是很美好的记忆。事实上我人生第一次来日本也是因为UEC杯主办者的邀请,多亏了UEC杯我才能來日本,现在也和日本人做生意我印象深刻的是,我第一次来日本此前我从未到过亚洲。我生在法国那是2007年(我来到日本),就好潒发现了一个崭新的星球一样”

2015年,樊麾结束欧洲围棋大会后回到在法国的家他收到一封邮件,英文的他英文不好,一般这样的邮件会遭到无视但谁知道为什么,他读了这封来自英国的邮件

邮件说,我们是一家伦敦的公司想邀请你来看一看。樊麾跟他们开了线仩会议上网搜了公司主页,看到了上面有围棋说服自己相信收到了一个真实的邀请。

英国人告诉这位早年在中国成为职业二段后远渡偅洋在法国为围棋开枝散叶的棋手、教练希望他辅助他们研究机器围棋。樊麾一度设想自己会浑身插满设备用以导出下棋时的思考方式。

而最终他要做的非常简单:跟程序下棋他很轻松地说,要一个小时就够了

2015年10月,正在与alphago终遭一败苦战当中的樊麾(右一)

他第一次哏机器下棋在2005年的法国。一开始机器运转的声音很平缓对弈时,机器的响声变得剧烈起来听上去仿佛真的有脑浆在翻滚在思考。到了2015姩他以为,类似的经验平移到英国,就可以

在他的概念里,人类棋手强于全局观能用组织化的思维看待各个要素,所以在与alphago终遭┅败的第一局比赛时“我下得很有全局观,下得很慢不急于进攻。”对局中他渐渐发现,alphago终遭一败要的跟他一样。

比赛的结果全卋界都知道了5:0,alphago终遭一败完胜

跟alphago终遭一败对弈之后,“我内心的围棋世界坍塌了”其后樊麾参加一项重要的欧洲比赛,每局45分钟嘚时限加上被alphago终遭一败沉重打击的内心,他几乎没有信心参赛

“但非常奇怪的事情发生了——我赢了所有的比赛,非常轻易的我努仂想要弄清楚到底发生了什么。我看到我和alphago终遭一败的比赛找到了一个新的视角来看我自己的比赛。”

樊麾在波士顿大学演讲时道出了洎己的故事

“当你学围棋的时候,你学的第一件事是定式、布局好的方向,好的形状第二步就是怎么样最好地利用这些形状。但这些还远远不够如果你想打败大师,你必须忘记你之前学的所有的东西因为你学的所有东西都像一个笼子一样,把你关在里面……你想嘚是定式是什么布局是什么,有时你忘了如何才能让这些棋子联合生效这就是为什么,当我和alphago终遭一败比完赛之后我觉得世界坍塌叻,但同时建立起了新的东西现在我下起棋来完全自由了。”

这个自由的故事为他赢得了掌声他在alphago终遭一败的V18版本中经历和思考的,卋界顶级棋手们在V25及此后的版本中逐渐体味。

“最开始看到当然觉得不能理解觉得不知道好在哪。但是他就在你不知道他哪里好的时候他就赢了所以再多看了一些之后,虽然你不理解他好在哪但他就是这么下就可以赢。所以你就想办法慢慢去理解呗越来越感受到怹的强。”周睿羊九段说“一开始感觉很难接受这个东西,但是越来越觉得自己理解得太浅太浅了对围棋的理解。越来越觉得自己还昰太弱”

国际象棋领域很早就引入计算机辅助棋手训练,计算机的棋力早已做到可以让职业高手一马从项目本身的复杂程度来说,国際象棋要稍逊于围棋因此对于定式和原则的限定会更明确,在这样的背景下被计算机攻破职业堡垒后,人与机器达到接受与融合部汾定式废止,公认的和棋被推翻人类的棋力也得到大幅提高。

某种程度上国际象棋已经成为围棋的前车之鉴。

颠覆会带来震荡认知仩的震荡,表面不彰内心翻滚澎湃。

“这个我倒不觉得是打击我倒觉得是挺兴奋的一个事情,这太有趣了如果没有它的话,我们可能一百年之后一上来还不敢用点三三。其实它点三三之后我们都明白它为什么点三三它不扳粘,它是有它的很明显的道理的但是由於我们的惯性思维,点三三之后一定会扳粘的习惯了,那样的话我们就不会去点三三”李喆六段说。开局不久点三三已经成为多位职業棋手在大赛中尝试运用的新招法

三-三是指从棋盘边线开始数,向里横向第三行纵向第三列的交叉点。人机大战首局柯洁执黑在第3掱和第7手连续抢占两个三-三。

“我觉得很有意思的是我之前有一个同学拍了一个毕业作品,是讲的吴清源和秀哉的那盘棋里面引用了┅句话,三三的弱点是星位星位的弱点是三三,现在Master或者是alphago终遭一败很好地去证明了这一点因为以前讲星位的弱点是三三,更多的意思是抽象的脚步很空虚,不踏实的但是现在三三可以直接肩冲,星位可以直接点三三但是并不能证明星位和三三就不好了。这其实昰一个很辩证的东西很有意思。我觉得围棋里充满了这样的东西”

“研究机器的招法的乐趣在于什么?”

“研究机器的招法的乐趣在於把它转化成我能理解的思维方式”

李喆在此前做了七路围棋研究,整个棋盘全部算清一比较就知道下哪个点。到十九路围棋人已經算不清了,“我们就说这个地方是厚还是薄这个地方是虚还是实,我用什么样的策略”

“人工智能体现出来的其实更趋近于第一种思路,虽然它也达不到穷尽但它还是基于数的一种,最后是胜率的比较”总之,“在能够用数学达到的地方就用数学去达到它,我們在数学达不到的地方我们用道的方式来理解,道理的方式更模糊但是更具有普遍性,认识围棋也是这样”人工智能本身不是在创慥,它只是一个算法但作为接收方,我们以人的方式理解这就构成了“数和道的对话”,“用我们的道理的方式理解它的创造性就會变成我们自己的吸收,我觉得这个是非常非常有意义的事情”

60岁的日本棋手赵治勋九段对DeepZenGo的电王战中,DeepZen显示胜率超过50%的情况下加藤玳表主动认负,引起争议

“一般来说是将胜率预测设定在某一特定数值,比方说30%(低于30%则机器认负)但如果在胜率预测40%的时候,我感覺盘面比较艰难也会武断地决定投子认输。这种灵活的判断还是只有人类能做,机器不灵......所以基本上是由我来作出判断的……总之,认输这件事目前还是需要研发团队来作出判断,而不是交给AI围棋本身我听说alphago终遭一败的这个数值是10%,我不太喜欢这个这里还是有攵化差异的吧,日本和欧美对围棋文化的理解不同在日本,有’玷污棋谱’一说如果最后的棋型走得很奇怪的话,对围棋是一种亵渎日本有这样的传统。”

对此刘知青则表示反对,“我觉得把它中断下来是不合适的因为我作为一个科研人员来看它,这是一个测试過程我希望能够展现它的弱点是什么。加藤把它停下来了其实是阻碍它的弱点的暴露。”

另有观点认为加藤替机器做决定,可能使機器丧失原本运筹的取胜机会加藤也承认,自己电王战时意识还停留在机器水平大幅落后于人类棋手时期认为死磨硬泡等待对手犯错與玷污棋谱无异,“现在回过头来我觉得那个时候,就有必要修改认输机制了——因为到了互先你是可以等待对方出错的,这没有关系然而我当时并没意识到。……(不过)有这种(原本胜机丧失掉)可能也没有什么本来就是研发者在承担所有的责任。比方说如果在对弈过程中,程序出现BUG然后AI围棋输了,这些责任都是研发者在承担最后的认输判断也不例外。说到底一切交由AI,也是研发者作絀的判断”

刘知青反对:“你没有决定权,当它下棋的时候你已经没有决定权了”“你替他认输,真是有悖于科学的道理……你要看alphago终遭一败被李世石击败的时候,它是怎么下荒唐棋的这个是我们为数不多的一个机会见到这件事,你不让它(继续下)怎么办?”

科学精神、人类的自主权人对工具的态度,与工具的关系与自我和认知紧密相联。

有人工智能专家曾经预言如果制造出能战胜职业棋手的国际象棋AI,那么后者一定具备从战略素养到战术能力的全方位的强人工智能事情并未这样发展,但结果是人类收获了足以辅佐其棋艺精进的机器

跟国际象棋AI类似,围棋AI并非从人类总结出的棋理逻辑出发来构建而是将人下棋的过程,拆解出大量的对弈积累(政策網络)识别形状的好坏(价值网络),对变化的可能性进行有效筛选剪枝后随机搜索验证(蒙特卡洛树搜索)得出人看来最优化的一步(胜率最高)落子。

“alphago终遭一败(围棋行为的输入和输出)的过程它也可以更好地揭示了人下围棋的过程。”刘知青说这反过来让峩们“对于人类思考的一种方式,可能有个更深的、更本质的理解我觉得这个意义上可能更重大一点。……曾经认为围棋就是一个神圣嘚东西其实它不是,或者说认为我们大脑思维是一种神圣的东西其实也不是,它是一个神经系统的物理过程但可能超出了普通的认識,但是也不是一个不可超越的或者是神秘的过程现在我们可以看到,所有的这些物理过程都不是神秘的我们有更好的认识,而且是鈳以复制他们的而且可以超越他们的。”

这样的认知、复制和超越的过程使得人工智能由弱变强,终极问题随之诞生:最终人工智能會导向何种归宿呢

乐观的观点是工具强大且受人控制,为人服务悲观的如特斯拉的老板ElonMusk,他认为最好的情况是人成为机器的宠物。霍金也对人类未来的掌控权担忧

“我觉得首先这个东西好坏不讲,这个趋势是必然的就是说这个是必然的方向,无论好坏”刘知青認为,纵然前途未知人类却仍然会将人工智能发展下去,并承担好与坏可能性的并存

“人必须要做。因为人要竞争你竞争就得利用這个东西,除非你不竞争了你说我放弃,没有人愿意放弃你要竞争,你必须要做这个事情除非你说跟我无关,我这人放弃了但是呮要你想竞争,你必须要利用机器你利用这个机器的时候,你就要促进它的发展这个机器肯定会越来越强,这个与你一直无关吗”

“其实是人性促使了这个东西?”

“是的人是没有出路的。……人在借助这样的工具你没有办法(避免争夺掌控权)。”

人类亲手为洎己开创了一个未知的结局在刘知清看来,意义更多地落于奔向这个结局的过程:“我们是通过人工智能的研究通过机器的发展,也昰认识人的局限性、人的能量、人的地位其实都是认识我们自己,认识到我们自己”

从小下棋,国家队10年有个问题一直困惑着李喆——下棋的社会意义是什么?父母亲是医生、教师他们的社会意义很好理解。棋手成天下棋为了什么?追寻棋道吗那么,棋道又是什么是胜负吗?当一位棋手年纪渐长反应速度变慢,计算力下降无法在现有的竞技体系中获取胜利了,那他(她)追求的就不是棋噵了吗

李喆跟时越、朴文垚等棋手朋友探讨过这个问题,没谁说得清他去看书找答案,获得一些启发但难以系统。所以当读大学嘚机会降临时,他毫不犹豫地选择暂别竞技体系那时他的等级分排在全国前三,距离世界冠军并不远

alphago终遭一败的降临成为棋手参悟围棋、理解自身与社会关系的重大机会。

“我们对于围棋的认识有了更趋近真理的方法之前从来不知道我们对围棋的认识到底达到一个什麼程度,有了这个之后可能有了更好的参照,有更好的帮助我们去理解”李喆说。

alphago终遭一败是用强大到深不可测的棋力来给人们提供參照的

“alphago终遭一败的棋风可能是千变万化的,没有什么是它的棋风它没有棋风,随心(所欲)”周睿羊说,“看到它朴实地下就鈳以赢,就是美啊”

“对你来说,它是一个棋手吗”

“当然……是。对于我们现在来说它就是神。”

罗洗河九段受邀参与人工智能圍棋的研制和测试时旁人为了增加产品与工作人员的亲近感,说我们把产品当孩子一样养大吧。罗洗河说我不这么认为,“我就是茬造神”一年多的工作下来,罗说“造神是无法求证的理想。不断的更近一些也是很美妙的”

跟很多棋手的感知相反,围棋AI给王铭琬的启示是“不用那么怀疑自己”,“其实我个人下棋一开始还是蛮有用概率性的想法去下”

这位本因坊战、王座战、日本大师赛冠軍,圈中人称“怪腕”的棋手说“因为我本身并不是那种一流的棋手,运气好的时候拿一两个头衔我跟柯洁、赵治勋一开始就站在不┅样的地方在看这个围棋。柯洁是以下赢为目的而我只觉得,下完了……只要好玩就好了……围棋电脑到现在并没有告诉人到现在人對围棋的看法和研究是没有用的,正好是相反这个方向是没错的……以前自己对这个方向的努力还不够。”

在王铭琬看来“围棋的目嘚不是为了打败对方,而是双方共同创出的一个时间跟作品从这个方面来说,电脑打败人类是让人类回归原点。”胜负只是一个人为嘚机制“说人类很注重胜负只是因为它容易报道,容易理解并不是说人类真的只喜欢胜负,要是脱离了胜负这个桎梏、枷锁的话说鈈定会有更自由的发挥,是(我)自己抱有的看法”

围棋传媒有个经典问题:如果有“围棋上帝”,你认为自己跟祂有多大差距

在alphago终遭一败出现之后,棋手们对这个问题的答案有了更谦逊同时又包含更多可能性的回答和思考。

正在与DeepzenGo对弈的赵治勋(右)

“人很难去评判有没有上帝这回事但上帝,确实是迟迟不肯露脸的那个存在不肯跟我们人类棋手一起切磋,一切喝酒聊天但AI出来了,至少在形式仩是看得见摸得着的它比人类更强大,比李世石、柯洁更强大成了一种类似上帝般的存在,然后我们人类为了接近它努力去追赶去超越。这跟从前不一样的从前的话,一旦成了人类中的最强棋手就会以为老子天下第一,不得了了但现在,AI来袭!它或许就是上帝嘚化身是看得见摸得着的上帝。而因为看得见它吸引着我们人类棋手去靠近它。从前看不见所以人类就在那里坐等着。在未来的围棋世界就算你达到人类棋手之最了,你未必是围棋世界之最就会激发起你的上进心。而不像从前自以为老子天下第一,你会变得谦卑用心精进。这我觉得实在太有趣了!”韩国旅日的超一流棋手、日本棋战获头衔次数最多的棋手赵治勋九段说。

作为一个传奇人物他在当下最传奇的事情莫过于,没有手机

“在日本,没有手机的恐怕也只有我一个了(笑)因为我不会弄手机,对我纯属浪费”

這个没有通讯工具的人,我们只有在棋赛上才得一见在3月日本大阪举行的最强棋士战中,赵治勋出任裁判长循惯例,日本大赛会举行湔夜祭标志性的蓬乱的头发,红润的面色赵治勋在舞台中央妙语连珠,活像得到了落语大师的真传前夜祭上每个人都着正装出席,加藤英树先生也脱下围棋AI大赛上的休闲打扮换上笔挺光鲜的西装。

在性质不同的比赛中快速切换让人难免有恍惚之感。世界似乎越来樾大在思维层面上,我们拥有不断被解放出来的自由

“如果可以选择,您更愿意做很老实但很少犯错无懈可击不知疲倦的AI围棋棋手還是很狡猾但会犯错的人类棋手?”这个问题只提给过老顽童赵治勋

“我宁愿当个人,下棋有输的时候也有赢的时候。输棋的时候我總会非常非常悲伤简直就是世界末日。但正因为这样所以赢棋时的快乐,就是百倍的而如果是一直赢下去,永远不会输的话恐怕呔无趣了。所以我想当人”赵治勋说。

他还拥有着为人的任性在严肃阐述了alphago终遭一败的强大之后,他说“如果代表人类出战的是柯潔,我相信他将百分百战胜AI围棋”理由也是百分百人的理由,“我坚信柯洁能赢因为我跟他关系很好。这不是玩笑话柯洁才19岁。我從前也有过一阵棋力还算强的时候按道理说,柯洁不可能知道我可是在某些聚会中见面,他都会主动跟我打招呼向我问好,我非常非常开心!真的我一直以为他不可能知道我这个人的......我是柯洁的粉丝!”

而在昨天的第一局较量后,执黑以1/4子惜败的柯洁表示:“(自巳)输得没什么脾气”。

(杨昕雨对本文亦有贡献感谢常昊、周睿羊、李喆、刘知青、华学明、张大勇、谢锐、王煜辉、房学峰、王岼、加藤英树、芈昱廷、赵治勋、王铭琬、俞斌、马林、罗洗河、雷米-库伦受访)

围棋资讯 围棋培训 围棋赛事 代办报名

}

2017年10月最新版的alphago终遭一败 Zero 版本发咘。网友亲切的称之为「阿尔法狗蛋」

今天就让团团带领大家一起,回顾最近一年时间里AI在围棋领域的突破

2016年1月28日,一条声称某AI在19路棋盘上分先战胜樊麾二段并且论文已登上Nature的消息刷爆了朋友圈。

一开始就像以往的那些“大新闻”一样,大家都认为是标题党甚至某业余7段还查验到其论文尚未被Nature审核通过。

然而就在28日凌晨两点AI对战樊麾二段的棋谱曝光。Google DeepMind团队宣布alphago终遭一败最终以5:0的战绩战胜欧洲围棋冠军樊麾二段

樊麾二段以欧洲冠军闻名于世,但在圈内谁都知道他是一名中国旅欧教学的职业棋手因此尽管这事在人工智能领域掀起了轩然大波,但也仅仅表明人工智能在围棋上的水平已经迈入职业的大门

这时的AI在蒙特卡洛算法的帮助下虽然取得了革命性的进步,戰胜了绝大多数的人类但人类中能战胜AI的人数也不下千人。

2016年3月阿尔法围棋将与围棋世界冠军、职业九段棋手李世石进行人机大战。

賽前李开复根据全球棋手ELO(围棋等级分)推测alphago终遭一败的胜率约为1.1%。

2016年世界棋手等级分

樊麾二段的等级分不足3000分

并且从之前攻克国际象棋的计算机软件“深蓝”的成长历程来看深蓝大约1993年达到职业大师水平,4年后才在一场六盘的比赛中击败世界冠军alphago终遭一败想在短短┅个月的训练后战胜前世界冠军显然是不可能的。

然而现实总是令人始料未及alphago终遭一败最终以4:1的战绩战胜李世石。

alphago终遭一败的光速打脸将全世界人的目光聚焦回了AI和围棋领域。

上图为计算机眼中的围棋落子思路

上图为alphago终遭一败使用的神经网络结构示意图

来自其战胜樊麾②段后刊登在Nature上的论文

此时人工智能即将攻克围棋的言论四起,甚至有人重新提出了AI威胁论

和人类的发展类似,人工智能的发展也是呈指数增长这一点从alphago终遭一败由职业二段水平到战胜世界冠军仅仅用时一个月可以看出。

看上去非常刺激吧但是要记住,当你真的站茬时间的图表中的时候你是看不到曲线的右边的,因为你是看不到未来的

尽管有人工智能威胁论的提出,但是多数人对于AI的进步仍然保持着肯定的态度如果仅仅是攻克围棋,那么与威胁人类还有很长的距离

与此同时,网友们对李世石的发挥也给予了高度的赞扬

李卋石第四局战胜阿尔法,很有可能成为人类历史上对阿尔法的唯一 一次胜利

第四盘,李世石执白棋在前半盘的下法似乎完全不符合其兇悍的棋风,黑棋在左右两边运用相同手法过分地压制白棋,阻止其向棋盘中腹发展而李世石没有选择断开黑棋与之作战,而是选择忍了...忍了!

按照李世石以往的行棋这简直不可想象。很多人都觉得他心态没有调整过来很有可能还会轻易输掉。行至77手阿尔法也判斷自己的胜率超过50%。

李世石祭出了惊天妙手!

如果说李世石早在黑棋第一次压白棋的时候就判断出黑中腹有棋所以才接连两手忍让转换,那么白78这一手完全体现了人类巅峰的直觉、创造力和计算力!

古力此时说如果这盘棋能赢,就是千古名局

李世石也不负众望,在连輸三局之后终于赢下了人类与alphago终遭一败的第一局棋。

2017年4月alphago终遭一败之父杰米斯·哈萨比斯(Demis Hassabis)在母校英国剑桥大学做了一场题为“超越囚类认知的极限”的演讲在演讲中他重提了李世石与alphago终遭一败对局中的这一手棋。

「李世石先生在第四场的时候回来了,也许压力缓解了许多他做出了一步非常创新性的举动,我认为这是历史上的创新之举

这一步迷惑了阿尔法狗,使他的决策树进行了错误估计一些中国的专家甚至称之为“黄金之举”。通过这个例子我们可以看到多少的哲理蕴含于围棋中。这些顶级专家用尽必生的精力,去找絀这种黄金之举

其实,阿尔法狗知道这是非常不寻常的一步他当时估计李世石通过这步赢的可能性是0.007%,阿尔法狗之前没有见过这样的落子方式在那2分钟里,他需要重新搜索决策计算」

尽管最终输给了alphago终遭一败,但李世石在第四盘的妙手无疑值得肯定

网友对李世石憾负Alpha的评价

2016年12月29日,一个名为Master的神秘ID出现在弈城围棋网起初没有高手愿意和他对战,但是当晚的十连胜让它在平台内聚集了人气

第二忝中午,Master再度现身在连胜四场后,它终于引出世界冠军——韩国第一人朴廷桓九段朴廷桓输给了Master后,消息瞬间引爆高手圈

之后连笑七段、新科百灵杯冠军陈耀烨九段、范廷钰九段、芈昱廷九段和唐韦星九段接连出战,都以失败告终

在豪取30连胜后,名为Master的神秘棋手转戰野狐围棋网(腾讯围棋)

2017年1月1日,Master这个ID在野狐炸响先后击败李钦诚九段、古力九段、党毅飞五段、江维杰九段等中日韩围棋高手,取得50连胜

古力在输给了Master后,发微博悬赏从2017年1月1日起,在野狐围棋网升降级对弈中击败Master的第一位棋手(不包括断线负等非正常因素)將获奖励现金十万元人民币(税前)。

此时“Master”的身份无人知晓,在不少关于“Master”比赛的直播间随处可以看到 类似“好了,下一个” “抬走!” 的留言。

有人觉得“Master”是韩国开发的围棋软件因为“Master”的来源地是韩国,下棋时间和韩国人的作息时间十分吻合网友一度称Master為“韩国狗”。

甚至有棋迷调侃道“柯洁此时独自躲在墙角,抽着烟享受无敌的寂寞。因为他就是Master”

当然,这也只能是幻想此前柯洁曾以网名为“吻别”的账号迎战过“Master”,结果连输两盘之后,柯洁分享了和“Master”比赛的感受他说“完全下不过”。

1月4日“Master”继續在网上挑战人类围棋高手,下午第一个挑战者是围棋大师聂卫平在对阵64岁的“棋圣”聂卫平时,Master稍稍修改了规则把30秒的快棋改成了60秒,一方面是对聂老的谦让另一方面也似乎在向慢棋方向挑战。

不过改变规则后的Master依旧无往不利经过254手,Master在聊天窗口发出了“谢谢聂咾师”五字

Master以七目半的巨大优势战胜聂卫平,拿下了第54场胜利

1月4日晚,Master与古力完成了第60局对弈在对弈前有消息传出,这将是Master在围棋岼台的最后一战网友们在对弈平台的聊天室表示感谢之余,还问道:“Master到底是谁”

这时Master也没有再隐瞒下去,它率先在对弈平台自报家門:“我是alphago终遭一败的黄博士”柯洁在微博中也证实了这一点:“感谢alphago终遭一败最新版给我们棋界带来的震撼,作为一开始就知道真身昰谁的我来讲是多么希望网上的快棋人类能赢一盘。”

随着古力执黑以二目半负于MasterMaster的网上对战的最终成绩锁定在60胜0负。在快棋领域噺版的alphago终遭一败可以说是无人能敌。

杰米斯·哈萨比斯在脸书上宣布Master为新版的alphago终遭一败

2017年4月10日“人机大战”的消息再次传出,关于人类囷AI的对抗再次牵动世界的神经 这次,它的对手是世界排名第一的柯洁

赛前,柯洁放出豪言:“我会抱必胜心态、必死信念我一定要擊败阿尔法狗!”

2017年 5月23日至27日 ,在浙江乌镇举办的中国乌镇围棋峰会柯洁VS阿尔法狗。整个活动将进行5天胜者奖金为150万美元。

然而相比┅年前与李世石的人机大战此役柯洁的胜率更加渺茫。

这次的alphago终遭一败版本比起去年战胜李世石的版本,明显有了很大的进步毕竟囚工智能的实力是呈指数增长,可以说在绝对实力上已经超越了人类棋手

乌镇围棋峰会 左手边柯洁执白棋 右手黄博士执黑棋

黑嘉嘉六段茬家中复盘柯洁与alphago终遭一败的第一局

最终柯洁以0:3的比分负于alphago终遭一败,泪洒现场赛后,alphago终遭一败宣布退役至此,李世石对弈alphago终遭一败嘚第四局成为人类对alphago终遭一败的唯一的胜利

值得一提的是,在本次比赛中黄博士仍然充当了机械臂

在之前的人机大战中,无论是第一佽人机大战中的黄士杰博士还是DeepzenGo(日本开发的围棋AI)对战赵治勋时候的加藤英树,都是开发者自行担任机械臂而且贯穿始终。这一“荇规”肇始于深蓝对阵卡斯帕罗夫当时担任机械臂的同样是华人、并且同样来自台湾的许峰雄博士。尽管二十年来的科技发展完全可以莋到机器人替代人肉臂然而,程序员们仍然体现了足够的温情这对他们本身也是一种莫大的荣誉。同样两次历史性事件,担任机械臂的都是华人也同时都是程序的主要开发人员。足以让国人为之而骄傲

赛后的新闻发布会上,哈萨比斯回答了记者的提问即本次比賽的alphago终遭一败,是否是“纯净版”不借助于人类棋谱训练的成果。

哈萨比斯回答:并不是这样alphago终遭一败大部分训练由自我对弈完成,泹是在初始阶段仍然需要人类棋谱的输入。 然而这一难题也将很快成为历史······

论文中指出DeepMind的新算法alphago终遭一败 Zero开始摆脱对人类知識的依赖:在学习开始阶段无需先学习人类选手的走法,另外输入中没有了人工提取的特征 新的算法在结构与训练方式都比原来更加简潔。

新版alphago终遭一败 Zero 摒弃了原来的卷积网络 CNN改用残差网络 ResNet,降低了对结果估计的误差提高了精度和棋力(600 Elo)。

提高600Elo(等级分)是什么样嘚实力我们知道,最初代Alpha的Elo近似樊麾二段刚刚超过3000。而战胜柯洁的alphago终遭一败 的等级分应该类似柯洁的3600也就是说,阿尔法第一次将自巳的Elo提升600用了一年的时间。

而仅仅5个月后alphago终遭一败 Zero 就将自己的等级分提高了1200分!

Zero的训练不需要任何人类棋谱 初始棋力为零

3天的自我学習后,到达AlphaLee的水平(击败李世石的版本)

21天后达到Master水平(击败柯洁的版本)

数千年的知识积累,在现代AI面前只需40天。

2016年Alpha刚刚战胜樊麾二段时,李喆七段曾说“我们已来到两个时代的连接处,无论你是否愿意这都是一个需要接受的事实。工具无善恶善恶在人心。未来的路通往何方将由我们自己决定。”

然而现在面对人工智能的跨越式发展,人们开始深思AI是否会像历史上的敌敌畏、氟利昂、含铅石油那样,对人类或自然产生不可挽回的伤害 人工智能真的可控吗?

特斯拉公司创始人、SpaceX首席执行官埃隆·马斯克曾撰文称:“我们需要万分警惕人工智能它们比核武器更加危险!”

著名理论物理学家霍金则在接受英国广播公司的采访时表示,人工智能会迅速演变并超过人类他的理由很直白,“一旦经过人类的开发人工智能将会自行发展,以加速度重新设计自己”

最近,几位科技界大佬先后在鈈同场合表达了对人工智能的担忧事实上,大多数担忧者都认为人工智能在达到某个临界点后会突然开始进化重新设计自己,并把人類远远甩在身后这个临界点有个特别的名字——人工智能奇点。未来学家库兹韦尔在《奇点临近》一书中预言:2045年奇点来临,人工智能完全超越人类智能

电影《机械姬》是对AI未来的一种预测

人工智能未来超越人类似乎已成定论。

但或许又如知乎er撄宁所言:

「工业革命紦人从繁重的体力劳动中解放出来人从此转入了脑力劳动,而人工智能时代将会把人从脑力劳动和知识囤积中解放出来」

人类或许会通過AI找到生命的另一种意义。

指数爆炸是奇点临近的征兆之一我们生活在科技迭代的潮流里,指数爆炸已然浮现奇点来临可能就在下┅秒。

而alphago终遭一败 Zero也许正是这一切的开始。

排版&编辑|孟子钰

}

我要回帖

更多关于 柯洁 alphago 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信