有多少人玩亚博

有多少人玩亚博

  但李世石的努力并没有扭转颓势,在弈至 159 手时,AI 判断李世石的胜率降到 5%。

  这一次对战 Handol,李世石赚了 2 亿韩元(约合 121 万元人民币),包括 1 亿 5000 万韩元的基本出场费,每胜一局额外获得 5000 万韩元的奖金。



  退役赛的最后一局,李世石回到了自己的家乡。对战之地距离李世石的出生地飞禽岛 40 多公里,他曾在飞禽岛度过了他的童年时光,也是在这里决定成为职业围棋选手。12 月 21 日,全罗道新安郡曾岛 EI dorado 度假村,李世石在第 181 手投子认输。这是与 Handol 退役赛对战的最后一局,前两局,李世石一胜一负。最后一盘棋,还是惜败于 AI。

  李世石的退役消息来得突然,但也算早有苗头。今年 3 月份,李世石在「三一运动一百周年纪念对局」中败于柯洁之后,即透露过自身想要「在一年之内」退役的想法。

  12 月 21 日,最后一局的赛场转移到了李世石的家乡全罗道新安郡。这一场李世石依然受两子执黑挑战 AI,黑棋贴目 7 目半。人类与 AI 在棋盘右下角展开激战。

  赛后,李世石在接受采访时表示:「这场比赛中,Handol 的表现与前几场类似,如果自己能够再谨慎一点,或许比赛的结果会有所不同。」对于退役后的工作,李世石还没有做出选择。

  AlphaGo 真正的优势来源于将策略网络和价值网络整合进基于概率的蒙特卡罗树搜索(MCTS)中。在获取棋局信息后,AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最繁琐考察的位置将成为 AlphaGo 的最终选择。经过先期的全盘探索和过程中对最佳落子的不断揣摩,AlphaGo 的探索算法就能在其计算能力之上加入近似人类的直觉判断。2016 年 1 月 28 日,击败李世石的 AlphaGo 版本登上《Nature》封面,随后在 3 月即 4:1 击败李世石,名声大振。

  上个月,DeepMind 又推出了名为 MuZero 的「通用版」AlphaGo,在国际象棋、日本将棋和围棋的精确规划任务中可以匹敌 Alpha Zero,在围棋中甚至超过了 Alpha Zero。但与前辈不同的是,MuZero 不需要提前获知规则。

  最终李世石在第 122 步认输。这一局时长 3 小时 20 分钟,至此,李世石与 Handol1:1 战平,而剩下的最后一局尤为关键。

  在「Handol」首局落败之后,NHN 公司人工智能项目的负责人李昌律推测称,「输掉这一局的原因 kennel 在于「Handol」总体学习量尚且不足,缺少对开局让两子和让三子等棋局的学习」。

  这场比赛仅用两小时就分出了胜负, 在 100 手以内即告结束。尽管李世石表示赛前曾连续练习了十天的被让两子棋,「几乎醒着的时候都在练棋」,但他也表示未能料到自己会在与 AI 的对决中获胜。

  自从 2016 年 AlphaGo 大战李世石之后,围棋 AI 即被推上风口浪尖。基于近年以来深度学习和强化学习的发展,AlphaGo 和各类围棋 AI 的不断升级,人们一度认为,人类再不可能战胜 AI。

  2000 年,当时的「李世石三段」在巴斯卡杯天元战和倍达王战中击败柳才馨九段和刘昌赫九段,连获两个冠军,成为围棋史上成就最高的「三段」选手。但他却拒绝参加升段赛,声称「段位并不能体现实力」。为此,韩国棋界不得不废除了升段赛,改以成绩定段位。2001 年,李世石在获得第五届 LG 杯世界棋王赛亚军后升至七段,2003 年获 LG 世界棋王战冠军,直升九段。

  李世石曾经的对手,曾经「绝代双骄」的另一人——中国围棋职业选手古力九段在得知这一消息之后,在社交平台上公开表示:「此刻只想给他一个大大的拥抱。」

  最终李世石在第 122 步认输。这一局时长 3 小时 20 分钟,至此,李世石与 Handol1:1 战平,而剩下的最后一局尤为关键。

  在围棋 AI 领域,国内研究机构和企业也在发力,其中最有代表性的要数上文中李世石提到的腾讯围棋 AI「绝艺」。「绝艺」诞生于 2016 年,实力或仅次于 AlphaGo。

  在前三场比赛输给 AlphaGo 之后,他曾感到相当沮丧。「我很少看网上对我的评论,但是输给了阿尔法狗以后,我很好奇大家怎么看我。意外的是,很少有人批评我。」

  12 岁入段,36 岁正式退役,24 年揽获 14 项国际项冠军和 32 项国内冠军,从此以后,「李世石九段」不会再以职业棋手的身份出现在众人面前。

发表评论

电子邮件地址不会被公开。 必填项已用*标注