当前位置:首页 > 新闻资讯 > IT业界 > 新闻
深度特写:从人类智慧壁垒守护者,到全世界赛前认定失败——柯洁与AlphaGo这一年都经历了什么?
  • 2017/5/31 16:33:53
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:
【电脑报在线】“我很早就知道自己要输1/4子,所以无奈苦笑。”新闻发布会上,柯洁说起了赛后点棋时自己的“诡异”微笑。

人类13年,不敌AI几个月

      5月23日850,围棋峰会正式开幕前,柯洁第一次见到了AlphaGo之父——人工智能公司DeepMind创始人兼CEO戴密斯•哈萨比斯。

      现场记者长枪短炮的包围下,在Alphabet公司(Google 母公司)董事长埃里克·施密特(Eric Emerson Schmidt)陪同下,哈萨比斯先与参与团体赛、配对赛的中国棋手握手见面。随后,在工作人员带领下,哈萨比斯与柯洁进行了简短的寒暄。这是两人的首次见面。

      “机器从来就不是站在棋手的对立面。”开幕式上,哈萨比斯如此表面自己的立场,无论这次“人机大战”的结果如何,“本质上都是人类的胜利,就像人类探索哈勃望远镜一样。柯洁是一个真正的天才,相信他和AlphaGo的对弈,将开启一个新的天地。   

      摄像摇臂此时转到台下的柯洁,出现在大屏幕中的柯洁一脸平静。他有何感受,没人知晓。

      但柯洁是有备而来的。

      10点30,比赛正式开始。柯洁执黑棋先下,AlphaGo由黄世杰执白棋后下。一开始,柯洁在左上角祭出了三·3点角。这个开局由传奇围棋大师吴清源和木谷实在上世纪30年代创立,曾经流行数十年,此后在现代围棋中渐渐淡出。今年1月,化名Master的AlphaGo在一系列比赛中再次启用此开局。

      柯洁模仿了它的下法,想看看对方怎么应对。一位参赛棋手对记者说,今年4月确认对决后,柯洁有意识寻找对抗AlphaGo软肋的方式,在这段期间内的8盘比赛中,柯洁尝试了很多从未用过的运子方式,面对柯洁如此的尝试和表现,业内人士评价他“越来越像AlphaGo了”。

    这样的说法也得到了柯洁的印证,赛后新闻发布会上,柯洁表示,他确实选择了针对性的下法。

      这并非柯洁与AlphaGo的首次交手。今年年初,AlphaGo以Master之名在奕城和野狐两大围棋网站踢馆,以60胜1平占据碾压中日韩顶尖职业高手,唯一一次平局也是因为对手意外断开了网络连接。

      柯洁也同“Master”有过交手,以落败而告终。“第一盘不知对手是谁,心态还好,后面因为知道对手不是人,心态就坏了。当时也吃不下饭,就住院了。”后来,柯洁在采访中称,人机对决给了他更大压力。

      柯洁也不是第一次面对人工智能。今年3月之前,柯洁在与腾讯围棋人工智能绝艺的对弈中,拿到过四连胜,而绝艺则取得过对柯洁的13连胜,其中绝艺执白7局取得5局胜利,绝艺执黑14场取得11局的胜利。

      在AlphaGo出现前,柯洁一度对认为自己已经至少掌握了围棋之道的50%,但多次被人工智能击败后,柯洁无奈地承认,自己学棋13年才达到现在这个棋艺的程度,而围棋AI从业余水平,只需几个月,就达到了人类顶尖棋手的最高水平。

      目前,国际职业围棋棋手排名采取Elo等级分制度。AlphaGo的进步令柯洁感到难以置信——2016年1月击败樊麾时,它的Elo在 3000 分左右,而到4月完败李世石时,这一数值已经达到了 3500 左右。Elo从3000到3500,AlphaGo 只用了五个月,而柯洁将自己的Elo从 3300 提升至 3600,则用了将近五年。

      快速提升背后,是AlphaGo全新的深度学习逻辑。这种经历迭代的深度学习逻辑,其强大力让人类难以望其项背。2016年1月,在国际顶级期刊《自然》的一篇关于DeepMind关于AlphaGo深度解析论文的封面报道。报道称,DeepMind为AlphaGo搭建了一个“将人类的直觉赋予了计算机”的神经网络——16万盘人类棋手的棋谱被输入AlphaGo,在学习了人类落子布局的特征后,它又自我对弈3000万盘,不断提高神经网络的精度。

      今年3月,柯洁说,“很多棋手都对AI走火入魔了,包括我。”他研究了很多的围棋软件,对AlphaGo 过去的每一局进行了详细研究。“有一段时间,我很想向AI学一些招数,但感觉把握不好。AI对一些局面的判断和把握,我们还没有完全理解,简单模仿学习AI的招法,还不能立即有好的效果。”

      在柯洁看来,“以彼之道,还施彼身”或许是自己能战胜AlphaGo的最大希望了,有人找出了柯洁的两条微博来证明:一条上说“终于用非常手段终结14连败了”,从棋谱看就是通过模仿棋打败了腾讯的AI绝艺。另一条微博里说:“感谢Alphago最新版给我们棋界带来的震撼……若不是住院,我将用上那准备了一个星期的最后一招”。有人猜测那一招就是模仿棋。

      只是,新版本的AlphaGO和去年战胜韩国顶级棋手李世石的版本相比,几乎是两个完全不同的“人”——之前 AlphaGo 提升一个版本需要 3 个月,现在只需要 1 周。AlphaGo 对阵李世石时的版本号是 V18,而当下的版本估计已经到了 V60,在逻辑上和棋局策略上已经今非昔比。

本文出自2017-05-29出版的《电脑报》2017年第21期 A.新闻周刊
(网站编辑:pcw2013)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖