人类棋手的最后赞歌

您所在的位置:网站首页 李昌镐与柯洁的对比 人类棋手的最后赞歌

人类棋手的最后赞歌

2024-06-08 21:58| 来源: 网络整理| 查看: 265

    2016年3月15日,李世石与AlphaGo战至第五局,最终1:4败下阵来,这也证明着人工智能时代的开启。而这一切都要从一位叫哈撒比斯的人说起。

    2016年,牛津大学迎来了一位叫哈撒比斯的演讲者,当时大家只知道他是一个Google旗下前沿人工智能企业DeepMind的创始人,但在场的人可能谁也没有想到,他在两个月后将给世界带来怎样的震撼。演讲中,他所展示的是大家童年的回忆——打砖块儿游戏。而驾驭这个游戏的玩家不是人,而是AI,也就是通过学习算法不断优化自己的程序,也就是具有学习能力的人工智能。在前100局游戏中,人工智能表现出来了一位菜鸡玩家的特征,经常接不到下落的小球,但它在不断学习中,渐渐明晰了游戏的玩法和技巧,到了第300局游戏时,它几乎不会再出现失误,每次都能稳稳地接住小球。虽然已经超越了大部分游戏玩家,但令人更感觉到恐惧的是,在游戏时间来到第500局时,AI通过自己的算法和学习已经能够达到通过墙体反弹来找到更优解的角度以达成更高效率的通关,也就是我们所熟悉的“脚本”。一个人工智能仅仅通过500局游戏便成为了人类望尘莫及的打砖块专家。

    然而这只是打砖块儿游戏,虽然当时有人被这个强大的自我学习的程序震撼到过,但他们也认为人工智能的限度也就只能停留在这些简单的算法上了。但哈撒比斯明显不这么想,他的野心让人工智能伸向了一个在后来改变世界的领域——围棋。

    围棋,被发明于几千年前的古代中国,黑白两字一人一步,361个交叉点,围住就可以吃掉棋子,最终比双方占领棋盘的大小就可以定输赢。看似规则简单,但围棋拥有着深奥的内容,围棋每走一步就有近200种选择,棋手需要尽可能多地考虑每一步所带来的变化和后续所产生的影响。想要通过数据演算围棋的每种情况录入数据库是完全不可行的想法,因为它的变化太过于丰富。作为人类有史以来所发明的最复杂游戏,哈撒比斯在演讲的最后放下豪言,人工智能将打败顶尖职业棋手。

    由于暴力检索和录入数据的办法行不通,AlphaGo开创了采用模拟人类思考学习的方法,由策略网络、快速走子网络和价值网络共同组成卷积神经网络,每步棋用蒙特卡洛搜索树收缩找到到最优解,再加上一个强化学习的RL系统,AlphaGo组装就此完成,这个强大的人工智能真的能击败职业棋手吗?

    AlphaGo展现出来了远超人类的学习速度,在AlphaGo出现伊始,deepmind公司的黄博士给阿尔法狗投入了3000万盘高水平人类棋谱,仅仅通过几天的极速学习,AlphaGo便从小白成长达到了高水平棋手的水准。在此之后,AlphaGo通过分身自我对弈的形式进行学习,每天就可以与自己对弈十万盘,从而更新算法和不断优化无限进步。要知道即使是职业棋手,整个生涯也只有几万盘的对局,而AlphaGo在刹那间便看透了前年万年。在超大量的数据整合下,AlphaGo迅速迭代更新至V13版本。在测试中,V13版本的AlphaGo以5:0完胜职业棋手樊辉,这也是AlphaGo第一次战胜人类职业棋手。很快,一场世纪对决即将到来,deepmind找到了人类传奇棋手——十四冠王李世石。2016年的李世石已达生涯末年,统治力已不再,但他仍是世界顶尖的棋手,世界排名第4(等级分)。然而在短短的一个月中,AlphaGo每天继续着恐怖的自对弈对局学习,当它来到李世石的对面时,已经更新迭代到了V18版本,这场举世瞩目的人机大战,一触即发。

2016年3月9日,韩国首尔,四季酒店

    李世石与AlphaGo的第一局比赛正式开始。李世石也是第一次面对这样的对手,在开局伊始,AlphaGo展现出来了十足的强悍棋风,在开局AlphaGo占据了场上的主动权。李世石在经过细致缜密的计算后下出了关键手,在这一步下完后,摄像机捕捉出了李世石的一个细致的动作,他抬头看向对方代替落子的黄博士,这是李世石的一种习惯,他习惯在关键时刻看向对手,通过对方的动作和表情来推测对方的情绪变化,探查对方的心理活动。一旦对方展现出来畏惧和不安的情绪,李世石便会主动出击,加强攻势,一举击溃对手。

    但当他抬起头时,他不自主地又低下头,他知道他无法从黄博士身上获取任何信息,因为真正落子的机器是没有感情可言的,他所面临的是只有冰冷算法的机器,以及它所运行的算法服务器。这局棋的进程没有太过跌宕起伏,战斗非常简单。许多职业棋手在观战时还一度认为李世石在中盘占据了优势,但李世石每次发动进攻时,都会被AlphaGo轻描淡写地一笔带过,轻松处理,AlphaGo的最优解使它的失误率无限下降,几乎给不到李世石任何机会。随着棋局的推进,AlphaGo稳固优势,没有给李世石留下任何翻盘的机会。酒店中和电视前的棋手这才反应过来,人类在AlphaGo面前是如此渺小。围棋,在强大的人工智能面前,就要宣告失守了吗?

    李世石经过第一局的比赛,深深感受到了坐在自己对面这台机器的可怕。他认为自己从棋局的一开始就落入了AlphaGo的节奏之中,而后便再也无法挣脱。他认为如果自己能够占据先机,发挥出自己的应有实力,是有获胜的能力的。第二局,李世石在布局阶段更加谨慎,来仔细判断开局的形式,以防自己在开局落入对方的节奏之中。然而,在持续的高强度的思考下,仅仅下出第36手后,李世石提出要去天台抽烟放松一下,缓解已经超载的大脑。

    然而在李世石出去抽烟放松的这段时间,AlphaGo经过远超人类大脑的运算能力,在第37手下出了载入围棋史册的开创性的一步——五路肩冲,这一步改变了后AI时代的围棋算法。李世石在看到这一手后,先是感到惊愕与差异,随后让自己冷静下来,这步棋是违反了人类的棋理的,粗看不是好棋,但在经过缜密计算后,李世石发现这步棋起到了桥梁的作用,李世石接下来无论在哪里发展都会被占到便宜。经过了长达12分钟的苦思冥想,没有找到有效的应对方案。

AlphaGo预见性的五路肩冲

    也正是从这一步棋开始,李世石再无还手之力,在后半局再次被AlphaGo一步步稳固胜局,输掉了比赛。在已经失去了悬念的情况下,李世石并没有选择投子认输,他选择继续下,企图以人类的身躯阻挡住强大的AI算法,但无奈早已无力回天,李世石,再次败下阵来。赛后,李世石久久没有离席,他认真复盘着每一步,企图找到对策,但总比分上他已经0:2落后了。

    第三局,决胜局。李世石将棋面彻底放开,采取了激烈搏杀的下法,这种棋风难以控制,但可以将棋局向最混乱的方向发展。李世石从一开局便与AlphaGo展开了决战,如同飞蛾扑火一般,面对李世石的猛烈攻势,AlphaGo高接抵挡,让李世石的每一记重拳都扑了个空。

    AlphaGo在中后盘不断巩固自己的优势,胜负已经明了,李世石在最后仍然奋力搏杀,李世石在为自己,在为人类棋手,争夺属于人类的最后一丝尊严。0:3,胜负已分。这也标志着,人类引以为傲的围棋,彻底被人工智能攻陷。人类的极限,远远不及人工智能。这三局比赛,人类是惨烈的,是壮烈的,人展现出来了强于机器的斗志与尊严,却无法抵挡住机器的算法。

    李世石在赛后哽咽道歉,要知道,李世石在曾经也桀骜不驯,年少轻狂,他在17岁说9段中18冠王李昌镐能力最差;狂言中国棋手除了古力每一个能打的;他故意不参加升段赛,在三段屡屡打败九段棋手,逼得韩国棋会给他破格升段。但这场比赛的打击彻底磨灭了李世石的锐气,他明白了自己在人工智能面前是多么的渺小,是多么的无力与无能。这是围棋界最大的一次失败,所有人都如同如梦初醒一般,他们发现自己倾尽一生苦苦钻研的东西被人工智能仅仅用几个月的时间攻陷,棋手的荣耀与尊严,在一夕之间,化为泡影。

    胜负已分,李世石在第四局决定放手一搏,为人类的尊严而战。第四局,比赛的伊始并没有太大的变化,李世石再次落于下风。他并没有急于扳回劣势,而是将每一步棋都仔细推演,算到最佳。第77手时,李世石的胜率已经很低,然而此时,李世石将通过载入人类史册的一手,被永远铭记在围棋和人类的历史长河之中。面对绝境,他明白局面已经濒临崩盘,是时候了。

挖!

“空挖”——神之一手

    古力在电视机前看到这一步时,将它称为“只可意会的一步棋”——神之一手。AlphaGo好像并没有理会这一手,而是简单地进行单退处理,继续推进者自己的算法。然而在几步过后,强大的人工智能这才后知后觉地发现,它对第78手这个空挖的判断出现了严重的失误,在哈撒比斯的电脑上,AlphaGo的胜率骤减,AlphaGo罕见地出现了算法上的错误,它不再继续通知着棋盘,在全世界的目光之下,犹如一位业余棋手一样,开始了迷惑的送死行为。哈撒比斯这时候才发现,AlphaGo出现了算法上的问题,人工智能居然已经无法再找到更优解的办法,而是选择了自我学习的方式探索!价值网络判断错误,搜索算法也彻底崩盘,AlphaGo开始了犹如初学者一般的下法。而导致程序错误的一手,正是李世石的第78手,神之一手——空挖。在AlphaGo的算法中,这手挖只有十万分之七的概率,而李世石,集中了AlphaGo的死穴,一击致命。第180手,AlphaGo投子认输,历史性的一刻也就此到来。

AlphaGo投子认输

    “我不想让AlphaGo预测出我的棋步,它也没有料到我会挖这一步,我终于赢一局了”李世石在赛后回忆到,“AlphaGo认输时,我听到许多人在欢呼,人类感到无助与害怕,因为我们人类在人工智能面前不堪一击,但这场胜利代表着人类的尊严,人类还是能战胜机器,我们仍然保有优势。虽然在未来打败人工智能可能会愈发困难,不过赢下这一局,就够了,一次就足够了。我从没想到过这个结果,我居然赢了,难以置信。”

    这场胜利,属于传奇李世石,也属于人类,全场和全球电视机前的观众为李世石报以掌声,这是人类的赞歌,这是人类的最后一次弑神。李世石为人类挽回了最后的尊严,为全人类而战,留住了人类的最后希望。

    2016年3月15日,第五局,李世石尝试执黑挑战AlphaGo,最终落败,总比分1:4输掉比赛,但这是人类历史上第一次,也很有可能是唯一一次,职业棋手战胜人工智能。在李世石第一局不敌AlphaGo的比赛后,一位叫柯洁的少年站了出来:“就算AlphaGo赢得了李世石,他也赢不了我。”这句话震惊了世界棋坛,也震惊了中国论坛。

柯洁微博

    面对着网友们的嘲笑,柯洁在微博上回击,引起了轩然大波。

截图取自up主木上野狐

    柯洁的年少轻狂有如年轻时的李世石,人们将希望又寄希望于年轻的柯洁身上。大家认为AlphaGo击败的也不是当世第一人,人类还没有输。而9个月后的乌镇,所有的希望,都化为了乌有。

    2016年12月29日,在李世石1:4负于AlphaGo之后,一个ID名为Master的棋手开始登陆各大围棋对弈平台,面对世界顶尖的棋手豪取60连胜(包括柯洁、古力),论坛纷纷讨论对Master的身份给予了猜测。

Master的统治力(截图取自up主木上野狐)

    1月4日,Master的身份公众于世,它就是AlphaGo的最新版本。为了不让李世石的神之一手再现,谷歌公司投入了大量资源给到deepmind,AlphaGo经过了9个月的自我对弈学习和技术算法的更新优化,AlphaGo从对阵李世石的V18版本已经进化到了V23版本。面对人类的顶尖棋手,Master往往在开局20手就占据了优势,随后稳步扩大优势,让人类再无翻盘机会,柯洁对阵Master的三局网络对局中用尽了全身解数也无法找到对策。Master版本的AlphaGo究竟有多恐怖?我们用一个数值来衡量——ELO等级分,有点类似于Rank排名分。在当时,李世石的ELO等级分有3538,排名现役棋手第12,柯洁作为世界第一有3671分,对阵李世石时的AlphaGo V18版本等级分大约在3800左右,这个分数虽然强于人类,但人类也并非闻风丧胆。

    而Master版本的AlphaGo是多少呢?4800分。AlphaGo Master版本在诞生仅仅8小时后对阵AlphaGo V18版本的战绩是100胜0负,4800分,这是人类远远地达不到的高度,这个境界已经完全超乎了人类的认知范围,职业棋手面对Master不堪一击。这是绝对力量,这是降维打击。

    然而柯洁在半年内不断调整和学习,接受了对AlphaGo Master的挑战,通过60盘对Master的网络对局学习Master的思路,积极备战对Master的比赛。

    “就算AlphaGo赢得了李世石,它也赢不了我。我这场比赛输了,那么就会被世人嘲讽,我不会怕,怕就输了一辈子。”柯洁面对1000多分ELO等级差的降维打击,面对着理论上不可能战胜的AlphaGo Master,他抱着必死的决心,2017年5月23日,乌镇,柯洁开始了比赛。

    首战中,柯洁执黑,他坚定了自己的惯用打法,先挖后补稳定局势。而AlphaGo下出了一步天马行空的棋——六路补征。包括柯洁在内的棋手都被这一步所震惊,然而在仔细思考之后,人们意识到了这一步的恐怖之处。这手气既补掉了征子,同时在扩张自己的同时限制了黑棋的阵势,一步三用。

六路补征

    这是远超人类能力的一步棋,这是AlphaGo Master所追求的最高效率,这就是人类所不曾踏足的算法。柯洁在数十手后便落入下风,此后AlphaGo Master再也没有给柯洁任何机会,0:1,柯洁先负一盘。人们开始陷入到悲观与绝望,世界第一的柯洁在Master面前是如此的渺小,犹如蚂蚁被坦克碾过一般,毫无还手之力。

    两天后,柯洁卷土重来,而第二局的对决,将会留下围棋史册之中,这将会是人类围棋历史上,竞技水平最高的一盘棋,而这场比赛的内容,彻底改变了整个后AI围棋时代,直至今日。柯洁执擅长的白棋。双方在布局阶段你来我往,柯洁率先发难,第20手,柯洁下出了在当时非常罕见的一步棋——二路点刺。这是柯洁自己研究出的“黑科技”。而AlphaGo Master冰冷地选择了最优解——弃子争先。双方在开局棋盘右上部的布局在后来形成了后AI时代赫赫有名的柯洁-Master定式。棋局慢慢进行,哈撒比斯惊人地发现,50手后,柯洁的胜率不但没有下降,反而还有上升,这在AlphaGo Master诞生以来是第一次发生如此的情况,在第50手一般Master早已占据了场上的主动权,而面对柯洁的恐怖算力,Master死死与柯洁缠斗。柯洁显然发现了这一点,他愈发紧张,他意识到局面大有所为,为了不让心脏跳得太快,他紧紧捂住胸口,保持冷静。

    柯洁将局面导向最复杂的情况,以局面的混乱来抓住AlphaGo Master的失误,在李世石的神之一手中,柯洁意识到AI不善于处理复杂局面,柯洁沿用了这一方法,企图用天意挑战强大的AlphaGo Master,这是柯洁的最强底牌。但经过了9个月的更新迭代,AlphaGo早已不是面对李世石的那台机器,现在的它不会给人类棋手任何机会,AlphaGo Master将每一步推演到最佳,而柯洁的精力在高强度的计算下被持续消耗,但他依然在坚持,到了90手,他的胜率仍然有44%,这是不可思议的一个结果,甚至超过了V18版本的AlphaGo,这是完全有机会挽回的棋局。

    但柯洁终究还是人类,在长时间的高强度计算之下,漏看了一枚隐蔽的劫财,这也导致本来均衡的局面瞬间崩盘,柯洁意识到问题所在时也为时已晚。0:2,柯洁无力回天。赛后,柯洁对漏看的这枚劫财懊悔不已,而坐在电脑面前的哈撒比斯在赛后盛赞柯洁的强大斗志力和高超的棋力,他表示在AlphaGo Master诞生以来没有任何一位棋手能和它缠斗如此之久,柯洁面临1000多分的ELO等级分差距,已经展现出了绝对顶级的水准,只是面对恐怖的Master,柯洁实在是太渺小。

    “在我被AlphaGo 2:0领先以后,我彻夜未眠。因为我一直在想我如何才能赢了它,它会不会有什么漏洞,哪怕是捡一盘也好啊!在第三局中,我竭尽全力以求一胜。因为在第二局的时候,我其实布局是领先的,布局的领先让我依稀看到了胜利的曙光。”柯洁很清楚这一点。他背水一战,两天后,2017年5月27日,柯洁对阵AlphaGo Master的最后一场比赛开始。

    柯洁极力抢到开局,并且使用了一步很有创新的二路点。但无情的AlphaGo Master告诉柯洁,即使是开局的一步棋,但在我上万步的演算之下,因为这步二路点,你将全盘再无机会。

    AlphaGo Master迅速布局,无情地找出最优解,顶住区域后先加强左侧再辐射全盘,柯洁奋力反抗,但他并不知道在那路二路点开始,这局棋的结局早已注定。临近结局时,柯洁鱼死网破式的在局部制造混乱,试图用混乱为自己带来一线生机,但在最后一个争胜局部,AlphaGo Master无情地用一个小尖灭掉了柯洁所有的努力。此时,柯洁摘掉了眼睛,埋下头失声痛哭。

    “它下完之后,我知道我这盘棋是不可能赢了。我感到浑身都在颤抖,真的,寒冷地颤抖。我再也控制不住情绪,赶紧冲出对局室,找到一个无人的角落里哭了起来。因为即将到来的3:0,这样的结局对我来说实在是太绝望了。裁判过来询问,我当时难过地连一句完整的话都说不出来,我就颤抖无力地说着:‘我做不到,我做不到,我赢不了,我真的赢不了。’这时候,AlphaGo团队的樊麾老师也赶紧跑到了我这里,来到了现场。他看见我哭了,就拍着我的肩膀安慰我说:’没关系的,柯洁,你已经做得很棒了!我们都是职业棋手,输给AI的感觉我们都懂,没关系的。’我当时特别感动。在我那样的时候,他俩可以离开自己的工作岗位来安慰我,这是我印象最深的一个画面。我真的抑制不住自己的情绪。我抱住他们,开始痛哭了起来,大声痛哭:‘我赢不了,我做不到!’我不记得我哭了多久,但是我明白,作为一个棋手,无论再困难、再绝望,也要把一盘棋给下完,因为这是职业棋手最基本的素养。所以我没有等得及把眼泪擦干,红着眼眶赶紧回到了对局室,坚持把棋给下完。”

    柯洁从小就是个胜负欲极强的孩子,他已经很久没有如此哭泣过了,这是属于柯洁的泪水,也是属于渺小人类的泪水。柯洁在微博的言论和他世界第一人的身份,让人们对这位19岁的少年充满了无限的期许。但当一切希望化为泡影时,人类,完败了。0:3,人机大战结束,柯洁继李世石之后留下了属于人类棋手的挽歌,在围棋、体育、人类历史上,留下了人类最后的、最伟大的赞歌。

    这番棋过后,柯洁回到赛场如同降维打击一般,在比赛中对阵人类棋手豪取20连胜。这,可能就是柯洁的倔强吧。

    “人工智能战胜人类棋手,最开始我们真的是很难接受的。很多人也因此发表了自己的观点:人类之间的对弈,会因为AI的出现变得没有意义。我不认同这种观点。我认为无论AI再强大、再厉害,也无法替代人类棋手对弈给我们带来的乐趣。”柯洁的发言是正确的。是的,围棋归根结底是一项体育运动,他是为人们带来快乐的,这也是棋类运动存在的意义,在竞技性之外,还有AI所不具有的人情。

    李世石与柯洁,人类棋手的最后挽歌,与AlphaGo的大战也就此结束。这宣告着人工智能时代的到来,也宣布着人工智能的成功,也象征着渺小的人类在强大的AI面前的最后尊严。



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3