两台阿尔法狗围棋棋谱对下围棋,会不会直接下到

人工智能围棋游戏下载|阿尔法狗围棋游戏下载_飞翔下载
单机游戏下载单机游戏下载基地
您的位置:
→ 阿尔法狗围棋游戏
类型:休闲益智
大小:73.5M
二维码扫描下载
最近人工智能阿尔法狗和韩国围棋高手李世石的人机大战如火如荼的进行者,而李世石的两连败一度也让好多小伙伴愤愤不平,纷纷想要自己试试看,所以小编就给大家带来了这款围棋类游戏,当然了这款游戏并不是人工智能阿尔法狗那款,但是普通玩家如果你能战胜这里面的最困难电脑也能说明你就是一位不错的围棋选手了。游戏介绍腾讯围棋是一款腾讯旗下的经典围棋作品,为广大棋迷打造最好的线上围棋!游戏特色集人人对弈、段位升降、人机对弈、打谱复盘、赛事直播、学棋练棋于一体包含休闲对弈19路、13路、9路,段位升降竞技,人机对弈等功能小编评测:其实大家并不用纠结这款游戏的人工智能问题,因为这个世界上目前真正像钢铁侠中Jarvis那样的人工智能目前并没有,并且在短时间内也不可能制作出来的,如果这种东西真被制作出来了,那么感觉人类或许真要开始进行一些清洗了。相关推荐:
围棋这个项目在很多不懂的同学心目中,总感觉要比象棋什么的高深的多,其实不然,入门的话还是比较简单的。中日韩是现今围棋的三大支柱,日本围棋整体水平止步不前,中韩围棋水平不断提高,形成了中韩争霸的局面。中
阿尔法狗围棋游戏
最新排行榜“阿尔法狗”为什么厉害
图为3月15日,在韩国首尔举行的2016围棋人机大战第五盘赛况,右为围棋世界冠军韩国棋手李世石。
谷歌的围棋人工智能程序和人类围棋冠军之间的比赛,堪称人工智能发展的一个重要里程碑,也让全世界的目光聚焦在人工智能这个热门科技领域。谷歌的人工智能程序是怎样赢了人类?人工智能对人类来说到底意味着什么,会带来什么?它会不会有一天在智能上也超过人类?
本版近期推出“关注‘人机大战’”系列报道上下篇,尝试揭开谷歌围棋人工智能程序赢得比赛的秘密,并分享相关专家对人工智能未来前景的预测。
从3月9日开始,一场人与机器的围棋大战吸引了全世界的目光。这场大战在韩国首尔上演,一直持续到15日,共5轮。大战之所以举世瞩目,是因为对战的双方是世界围棋冠军李世石与围棋人工智能程序AlphaGo。令人惊叹的是,整个比赛过程中,AlphaGo的表现都堪称完美,最终以4:1击败李世石。
这个战胜人类世界围棋冠军的AlphaGo程序到底是何方神圣?它为什么如此厉害?
“阿尔法狗”是什么?
一款人机对弈的围棋程序,棋艺不是开发者教给它的,而是“自学成才”
AlphaGo程序是美国谷歌公司旗下DeepMind团队开发的一款人机对弈的围棋程序,被中国棋迷们戏称为“阿尔法狗”。游戏是人工智能最初开发的主要阵地之一,比如博弈游戏就要求人工智能更聪明、更灵活,用更接近人类的思考方式解决问题。
1997年,IBM的“深蓝”计算机首次击败国际象棋世界冠军卡斯帕罗夫,成为人工智能战胜人类棋手的第一个标志性事件。此后近20年间,计算机在诸多领域的智力游戏中都击败过人类。但在围棋领域,人工智能却始终难以逾越人类棋手。直到2015年,由谷歌开发的这款“阿尔法狗”程序才首次战胜欧洲围棋冠军樊麾。
为什么对于人工智能而言,围棋的难度这么大?中国自动化协会副理事长、秘书长王飞跃说:“首先,围棋的可能性太多。围棋每一步的可能下法非常多,棋手起手时就有19×19=361种落子选择。一局150回合的围棋可能出现的局面多达10170种。其次,是规律太微妙,在某种程度上落子选择依靠的是经验积累而形成的直觉。此外,在围棋的棋局中,计算机很难分辨当下棋局的优势方和弱势方。因此,围棋挑战被称作人工智能的‘阿波罗计划’。”
既然围棋对于人工智能来说这么难攻克,那么对于AlphaGo程序的设计者来说,是否也需要具备很高的围棋水平?
“这个不需要,设计者们只需要懂得围棋的基本规则即可。AlphaGo背后是一群杰出的计算机科学家,确切地说,是机器学习领域的专家。科学家利用神经网络算法,将棋类专家的比赛记录输入给计算机,并让计算机自己与自己进行比赛,在这个过程中不断学习训练。某种程度上可以这么说,AlphaGo的棋艺不是开发者教给它的,而是‘自学成才’的。”王飞跃说。
“阿尔法狗”怎样下棋?
用两个神经网络大脑——策略网络和估值网络,像人类棋手一样判断当前局面,推断未来局面
AlphaGo到底是如何下棋的呢?
AlphaGo通过蒙特卡洛树搜索算法和两个深度神经网络合作来完成下棋。在与李世石对阵之前,谷歌首先用人类对弈的近3000万种走法来训练“阿尔法狗”的神经网络,让它学会预测人类专业棋手怎么落子。然后更进一步,让AlphaGo自己跟自己下棋,从而又产生规模庞大的全新的棋谱。谷歌工程师曾宣称AlphaGo每天可以尝试百万量级的走法。
“它们的任务在于合作‘挑选’出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围内。在本质上,这和人类棋手所做的是一样的。”中国科学院自动化研究所博士研究生刘加奇说。
什么是蒙特卡洛搜索树算法?
有专家曾通俗地解释:假如篮子里有1000个苹果,让你每次闭着眼睛找一个最大的,可以不限制挑选次数。于是,你可以闭着眼随机拿了一个,然后再随机拿一个与第一个比,留下大的,再随机拿一个,与前次留下的比较,又可以留下大的。循环往复这样,拿的次数越多,挑出最大苹果的可能性也就越大,但除非你把1000个苹果都挑一遍,否则你无法肯定最终挑出来的就是最大的一个。这就是蒙特卡洛搜索,它被广泛用于科学和工程研究的算法仿真中。
“传统的棋类软件,一般采用暴力搜索,包括深蓝计算机,它是对所有可能结果建立搜索树(每个结果是树上的一个果实),根据需要进行遍历搜索。这种方法在象棋、跳棋等方面还具有一定可实现性,但对于围棋就无法实现,因为围棋横竖各19条线,落子的可能性大到计算机无法构建这棵树(果子太多了)来实现遍历搜索。”中国科学院自动化研究所研究员易建强说,“而AlphaGo采用了很聪明的方法,完美解决了这个问题。它利用深度学习的方法降低了搜索树的复杂性,搜索空间得到有效降低。比如,策略网络负责指挥计算机搜索出更像人类高手该落子的位置,而估值网络负责指挥计算机搜索出后续更有可能获胜的一个落子位置。”
刘加奇进一步解释,深度神经网络最基础的一个单元就类似我们人类大脑的神经元,很多层连接起来就好比是人类大脑的神经网络。AlphaGo的两个神经网络“大脑”分别是策略网络和估值网络。
“策略网络主要是用来生成落子策略的。在下棋的过程中,它不是考虑自己应该怎么下,而是想人类的高手会怎么下。也就是说,它会根据输入棋盘当前的一个状态,预测人类下一步棋会下在哪儿,提出最符合人类思维的几种可行的下法。”
然而,策略网络并不知道自己要下出的这步棋到底下得好还是不好,它只知道这步棋是否跟人类下的是一样的,这时候就需要估值网络来发挥作用了。
刘加奇说:“估值网络会为各个可行的下法评估整个盘面的情况,然后给出一个‘胜率’。这些值会反馈到蒙特卡洛树搜索算法中,通过反复如上过程推演出‘胜率’最高的走法。蒙特卡洛树搜索算法决定了策略网络仅会在‘胜率’较高的地方继续推演,这样就可以抛弃某些路线,不用一条道算到黑。”
AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。在利用蒙特卡洛树搜索算法分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。
人工智能会对人类造成威胁吗?
目前并不会对人类造成威胁,人工智能技术为人类提供了解决问题的强大工具
专家们表示,AlphaGo成功的秘诀就是让计算机知道如何完成目标并通过经验来提高,而不是每项任务都通过手写指令来完成。
“这个秘诀实际上就是深度学习。它是指多层的人工神经网络和训练它的方法。简单通俗地讲就是指计算机通过深度神经网络,模拟人脑的机制来学习、判断、决策。近年来,这种方法已被应用于许多领域,比如人脸识别、语音识别等等,总之它在近期和未来都将是人工智能领域的一个热点研究方向。”易建强说。
此次AlphaGo的胜利被业界认为是人工智能发展当中的一个重要里程碑。
“它的一些算法的机理可以运用到其它领域,去解决一些对抗性的问题,甚至还可以应用到以后的商业和金融交易当中,或者是城市的交通管理等方面。”刘加奇说。
很多人都担心人工智能的发展会威胁到人类的生存,这次AlphaGo能在典型的反映人类智慧的比赛中打败人类,则更加重了人们的担忧。
对此,记者采访的几位专家都表示人工智能并不会对人类造成威胁。他们认为,人工智能技术为我们提供了强大工具,有助于专家更快做出突破,提高我们应对那些亟待解决的全球性难题的能力。
“我们需要机器学习来帮助处理复杂问题,预测未知,支持我们实现以往不可能的目标。”王飞跃说。
“当然相比围棋,城市拥堵的治理等问题难度更大。因为围棋的数据结构是一样和固定的,而我们生活当中很多的数据结构并不统一,比如城市拥堵方面的大数据结构,因此让计算机从这些非结构数据中获取知识是非常难的,要实现还需要很长的时间。”易建强说。
[责任编辑:第A06版:今日关注&&&&
第A01版第A02版第A03版第A04版第A06版第A07版第A08版第A09版第A10版第A11版第A12版第A13版第A14版第A15版第A16版
那个人工智能(AI)围棋程序首盘真的赢了
阿尔法狗“手撕”李世石
有人慌了:AI会不会造反?
&&&&一方是拥有10多个围棋世界冠军头衔的最高级别人类选手;一方是来自Google现阶段人工智能围棋程序,昨日,举世瞩目的围棋大师李世石大战阿尔法狗(“阿尔法围棋”,狗是围棋英文GO的音译)的比赛在韩国首尔上演。经过3个半小时的鏖战,韩国九段棋手李世石投子认负,输掉了这五番棋中的第一场。双方第二局比赛将于今日打响。值得一提的是,去年10月,阿尔法狗曾在五局三胜制的比赛中,以5∶0完胜欧洲围棋冠军、职业二段选手樊麾。&&&&李世石&&&&韩国棋手,33岁,1995年正式入段,年升级为二段、三段,2003年因获LG杯冠军直接升为六段,并在2003年7月获第16届富士通杯冠军后直接升为九段,是过去10年获得围棋冠军头衔最多的人。他属于典型的力战型棋风,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。&&&&阿尔法狗&&&&美国谷歌公司旗下人工智能公司“深度思维”开发的智能软件。它可以运行在不同的硬件平台上。其“单机”版本用到48个CPU(中央处理器),而还有一个分布式运算的版本,可同时用到多台计算机的1202个CPU,大大提升计算能力。除了超强的计算力,阿尔法狗最大的特点是它会自己学习。在战胜樊麾之前,阿尔法狗已进行了超过3000万局的自我训练,不断提升棋力。&&&&揭秘&&&&把李世石逼到认输的是怎样一个AI?&&&&为什么是围棋不是别的?&&&&游戏,是AI最初开发的主要阵地之一。博弈游戏要求AI更聪明、更灵活、用更接近人类的思考方式解决问题。但有一个游戏始终是人类大脑的专利——古老的围棋。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步。&&&&它的“神经网络”是个啥?&&&&阿尔法狗的核心,是两种不同的深度神经网络“策略网络”和&“值网络”。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里。阿尔法狗利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样它在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。&&&&超强学习能力有没有上限?&&&&对于这个问题,英国曼彻斯特大学计算机科学教授凯文·柯伦表达了否定态度。他认为,我们没有理由相信技术会有极限,特别是在阿尔法狗这样的特定领域。而来自南京大学计算机系的两位专家周志华和俞扬则都认为,上限是客观存在的。周志华表示,“强化学习”奏效的关键,是两个模型都不错,而且有足够大的“差异”。当模型性能提升以后,其差异会显著下降,到了一定程度必然会使性能无法继续通过这种机制提升。其上限取决于高质量“有标记”样本(相当于真实李世石水平棋手的棋局)的数量。&&&&选手赛后说&&&&●&李世石:我对“阿尔法围棋”的表现感到吃惊。其实我一直认为不会输掉。但“阿尔法围棋”下得那么完美,真没想到。我认为因为序盘布局的失败,黑棋一直处境艰难。&&&&大咖怎么看&&&&●&华学明(中国围棋队领队):并不是说人工智能赢了,围棋的神秘感就没有了,现在的程序并没有完全体现围棋的思维。&&&&●&俞斌(中国围棋队总教练):李世石这盘棋发挥得不好,其实也未尽全力。电脑具备很多人所不具备的优势,最主要的还是心态。&&&&本地龙门阵&&&&●&云南职业棋手段嵘(职业七段):电脑学习很快,看来超过人类是迟早的事了。但这不会对围棋发展有什么不利,相反,电脑强大了,对围棋的普及和推广更有利,而围棋中的交流,特别是围棋修身养性的特质,是电脑无法取代的。&&&&本报记者&秦浩&&&&观赛全攻略&&&&7天内交锋5次&&&&胜方将获100万美元&&&&●&比赛赛程:此次对战分为5局,分别是:3月9日、3月10日、3月12日、3月13日和3月15日的北京时间12点&&&&●&比赛胜负:五盘对局,取得三局或三局以上者为胜。若比赛出现3-0或3-1已经分出胜负后,也将下满5局,以让阿尔法狗获得更多的学习机会。&&&&●&比赛规则:将采用贴7.5目的中国规则。每位棋手各有两个小时布局时间,3次60秒的读秒。&&&&●&比赛流程:比赛时李世石在棋盘上落子,助手将手数输入电脑传送给阿尔法狗,阿尔法狗的手数则由助手摆到李世石落子的棋盘上。&&&&●&比赛奖励:获胜的一方将获得100万美元奖励。若阿尔法狗获胜,奖金将捐献给联合国儿童基金和其相关公益团体。&&&&追问&&&&人工智能,会造反吗?&&&&阿尔法狗除了超强记忆外,还能够自主学习,在下棋时就能不断进化技艺。这样的技能,怎能不让纠结于棋类智力的人类心理压力大增?事实上,人类一直未摆脱对人脑与电脑双方优劣的关注:机器会比人聪明吗?聪明的机器是否会控制人类?机器到底挑战的是一个人,还是整个人类?更深一层的追问是,如果连人类派出的最优秀代表之一都输给了电脑,那下一次人类还将输掉什么?连智慧都输掉了,人类还剩些什么?&&&&但如果只因一场棋局就判断人类智慧最后的堡垒会被攻破,人类的智力会受到威胁,这似乎有夸大之嫌。那是因为,机器在各类智力游戏中击败人类本就是迟早的问题,但这并不意味着机器与人拥有同样形式的智能,而只说明在某些功能上,机器做到了类似、甚至超过了人类。更何况,机器有智力、缺智慧的问题依然未解决,与人类相比,它看不懂莎士比亚,当不了莫扎特,也写不出《相对论》。所以,与其在胜负上纠结,不如发挥智慧,提前设计好“路线图”和“安全阀”,让技术更好地推动社会文明发展。&&&&声音&&&&阿尔法狗创始人:&&&&希望下个对手是中国柯洁&&&&阿尔法狗创始人哈萨比斯接受采访时表示,他希望“阿尔法围棋”能与中国的高水平棋手对弈,比如柯洁。&&&&年仅18岁的柯洁是新一代中国围棋棋手领军人物,曾8次击败李世石。但对于是否也愿意和阿尔法狗来一场的问题,柯洁却给出了否定的答案:“我并不想和阿尔法狗比赛,它一定是弱于我的,我不想让它拷贝我的比赛思路。”&&&&综合新华社、中国日报等
<INPUT type=checkbox value=0 name=titlecheckbox sourceid="SourcePh" style="display:none">
新闻爆料热线:7 4156165 手机彩信爆料请发内容至: 短信爆料请发内容至:
云南日报报业集团版权所有,未经书面授权请勿转载或建立镜像,违者依法必究
YearPh-MonthPh-DayPh HourPh:MinutePh:SecondPh
云南网 滇ICP备  经营许可证编号:滇B-2-4- (R)
All Rights Reserved since 2003.08
<input type="hidden" name="PubTime" id="PubTime" value=" YearPh-MonthPh-DayPh " />广告加载中...
  2016年这把火烧得很旺,尤其是AlphaGo( 阿尔法狗)对战李世石,让我们真正见识到了的可怕。不过,最近笔者花功夫研究了下国外关于阿尔法狗围棋对弈的人工智能解读,发现此前我们听到的、看到的或者说以为认识到的东西,几乎都是错的,阿尔法狗可能并非你想的那样强无敌。
  错误一:
  阿尔法狗可以说是里程碑式地开创了历史,但是它并没有作出任何非常创新的技术,而deep mind只是将早已经存在的一些人工智能技术尤其是机器辨认图片技术运用到下棋上,之前没有人想过能这样做,这种尝试是一种创新。
  错误二:
  阿尔法狗并没有真正的棋感,实际也不懂得思考并作出策略,围棋解说把阿尔法狗当人来看待是错误的。阿尔法狗只是不停问自己,我下这一步我胜率提高了多少。
  错误三:
  阿尔法狗并没有强大的学习能力,达到现在棋力是基于接近1亿次棋局的模仿和推测出来的,一开始阿尔法狗只学习了16万棋局时它的棋力很弱。他不但比人学习效率差而且比马戏团的动物学习效率更差。所以说,跟李世石对局每一局都在进步是不可能的,一局的经验对阿尔法狗基本没什么影响。
  错误四:
  阿尔法狗其实也是基于蛮力穷举的下法,只不过运用新的机器学习方法。穷举法和机器学习不矛盾。
  错误五:
  之前看到文章说阿尔法狗速度没深蓝快,其实阿尔法狗是深蓝的5万倍,今天用的iPhone6s计算能力都是深蓝的几十倍。
  错误六:
  说人脑计算速度慢是错误的,和计算机的计算速度相对应的,应该是人脑神经元计算速度,保守估计人脑计算速度是每秒1000万亿次,计算能力是深蓝的10万倍。
  错误七:
  阿尔法狗并不是完全学习的,首先底层需要人编程围棋规则,其次基础的下棋原则也是人为输入的。
  简单总结一下,其实包括阿尔法狗围棋程序和深蓝的象棋都是蛮力搜索法,也就是:其一,考虑所有未来可能变化;其二,计算走法未来多少步的胜率;其三,选择走法。但是围棋每走一步比国际象棋变化更大,步数更多,可能变化种类超过宇宙原子总和。其实这对于象棋也是如此,深蓝雇佣大量职业象棋选手设定一个积分法,比如一个兵值多少分,,吃对手一个车胜率提升多少,这个评分体系很准确,深蓝思考范围被压缩成十几步。
  但是围棋无法如此评估,之前围棋程序是简单的人手输入,见到什么情况如何走,所以很死板,这些程序棋力大概是400。
  2006年一种叫做蒙特卡洛树的搜索法被发明,它使用概率模拟方法(类似模拟投掷骰子),只需要判断终盘胜负,弥补了围棋不能设定确定走法函数的缺陷(阿尔法狗也是使用蒙特卡洛树方法)。但是这方法要展开到终盘,计算量太大,所以需要让围棋专家协助制定行棋规则,减少计算量,此方法可使人工智能棋力提升到业余5段。
  但是十年来电脑棋力进展令人悲观,直到阿尔法狗,它在此基础上引入深度人工网络。神经网络已经发明50年,适合编写一些不直观因果关系的事物,并且软件可以自主学习调整。但是编程太难,加上以前计算能力问题一直不受重视。
  6年前开始,技术上能达到10层神经元,神经网络开始兴起。结合大数据和云计算技术,神经网络开始吃香。图像处理和人脸识别这类程序很难直观的由编程员编程,神经网络在此有用武之地,其中深度卷积网络技术称霸。阿尔法狗团队创新之处在于,意识到可以将图像识别的这项技术用于下棋,并将神经网络升级到13层,预测人类棋手走法。
  首先它学习了围棋对战平台的3千万业余高段位的对局记录,作为让阿尔法狗猜人类走法的正确答案。也就是说,阿尔法狗一开始是在模仿业余高手平均玩法,同时团队人工输入围棋知识。可以说,阿尔法狗是神经网络加手工编程混合物。
  这个预测人类玩法被叫做策略网络,此时阿尔法狗叫做RP版。根据阿尔法狗团队的论文,把策略网络加入业余3段棋力的围棋程序,其棋力能达到业余6段,棋力提高950分达到2600(棋力分每相差230分,双方5局三胜比赛的胜率为高分者95%胜率),此时alpha已经成为世界最强围棋程序。
  为了减少计算量,阿尔法狗使用一个叫价值网络的深层卷积网络作为评估函数,使用阿尔法狗的预测结果和实际展开结果的平均值作为胜率参考信息。加入此功能的阿尔法狗叫做完整版,其棋力提高了450分,达到了惊人的3100。
  &&&分割线&&&&
【版权与免责声明】发现内容存在版权问题,烦请提供相关信息发邮件至,我们将及时沟通与处理。本站内容除非来源注明源码网,否则均为网友转载,涉及言论、版权与本站无关。&
热门文章榜}

我要回帖

更多关于 阿尔法狗横扫围棋界 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信