深度特写：从人类智慧壁垒守护者，到全世界赛前认定失败——柯洁与AlphaGo这一年都经历了什么？

2017/5/31 16:33:53
类型：原创
来源：电脑报
报纸编辑：电脑报
作者：

【电脑报在线】“我很早就知道自己要输1/4子，所以无奈苦笑。”新闻发布会上，柯洁说起了赛后点棋时自己的“诡异”微笑。

人类13年，不敌AI几个月

5月23日8点50，围棋峰会正式开幕前，柯洁第一次见到了AlphaGo之父——人工智能公司DeepMind创始人兼CEO戴密斯•哈萨比斯。

现场记者长枪短炮的包围下，在Alphabet公司（Google 母公司）董事长埃里克·施密特（Eric Emerson Schmidt）陪同下，哈萨比斯先与参与团体赛、配对赛的中国棋手握手见面。随后，在工作人员带领下，哈萨比斯与柯洁进行了简短的寒暄。这是两人的首次见面。

“机器从来就不是站在棋手的对立面。”开幕式上，哈萨比斯如此表面自己的立场，无论这次“人机大战”的结果如何，“本质上都是人类的胜利，就像人类探索哈勃望远镜一样。柯洁是一个真正的天才，相信他和AlphaGo的对弈，将开启一个新的天地。

摄像摇臂此时转到台下的柯洁，出现在大屏幕中的柯洁一脸平静。他有何感受，没人知晓。

但柯洁是有备而来的。

10点30，比赛正式开始。柯洁执黑棋先下，AlphaGo由黄世杰执白棋后下。一开始，柯洁在左上角祭出了三·3点角。这个开局由传奇围棋大师吴清源和木谷实在上世纪30年代创立，曾经流行数十年，此后在现代围棋中渐渐淡出。今年1月，化名Master的AlphaGo在一系列比赛中再次启用此开局。

柯洁模仿了它的下法，想看看对方怎么应对。一位参赛棋手对记者说，今年4月确认对决后，柯洁有意识寻找对抗AlphaGo软肋的方式，在这段期间内的8盘比赛中，柯洁尝试了很多从未用过的运子方式，面对柯洁如此的尝试和表现，业内人士评价他“越来越像AlphaGo了”。

　　这样的说法也得到了柯洁的印证，赛后新闻发布会上，柯洁表示，他确实选择了针对性的下法。

这并非柯洁与AlphaGo的首次交手。今年年初，AlphaGo以Master之名在奕城和野狐两大围棋网站踢馆，以60胜1平占据碾压中日韩顶尖职业高手，唯一一次平局也是因为对手意外断开了网络连接。

柯洁也同“Master”有过交手，以落败而告终。“第一盘不知对手是谁，心态还好，后面因为知道对手不是人，心态就坏了。当时也吃不下饭，就住院了。”后来，柯洁在采访中称，人机对决给了他更大压力。

柯洁也不是第一次面对人工智能。今年3月之前，柯洁在与腾讯围棋人工智能绝艺的对弈中，拿到过四连胜，而绝艺则取得过对柯洁的13连胜，其中绝艺执白7局取得5局胜利，绝艺执黑14场取得11局的胜利。

在AlphaGo出现前，柯洁一度对认为自己已经至少掌握了围棋之道的50%，但多次被人工智能击败后，柯洁无奈地承认，自己学棋13年才达到现在这个棋艺的程度，而围棋AI从业余水平，只需几个月，就达到了人类顶尖棋手的最高水平。

目前，国际职业围棋棋手排名采取Elo等级分制度。AlphaGo的进步令柯洁感到难以置信——2016年1月击败樊麾时，它的Elo在 3000 分左右，而到4月完败李世石时，这一数值已经达到了 3500 左右。Elo从3000到3500，AlphaGo 只用了五个月，而柯洁将自己的Elo从 3300 提升至 3600，则用了将近五年。

快速提升背后，是AlphaGo全新的深度学习逻辑。这种经历迭代的深度学习逻辑，其强大力让人类难以望其项背。2016年1月，在国际顶级期刊《自然》的一篇关于DeepMind关于AlphaGo深度解析论文的封面报道。报道称，DeepMind为AlphaGo搭建了一个“将人类的直觉赋予了计算机”的神经网络——16万盘人类棋手的棋谱被输入AlphaGo，在学习了人类落子布局的特征后，它又自我对弈3000万盘，不断提高神经网络的精度。

今年3月，柯洁说，“很多棋手都对AI走火入魔了，包括我。”他研究了很多的围棋软件，对AlphaGo 过去的每一局进行了详细研究。“有一段时间，我很想向AI学一些招数，但感觉把握不好。AI对一些局面的判断和把握，我们还没有完全理解，简单模仿学习AI的招法，还不能立即有好的效果。”

在柯洁看来，“以彼之道，还施彼身”或许是自己能战胜AlphaGo的最大希望了，有人找出了柯洁的两条微博来证明：一条上说“终于用非常手段终结14连败了”，从棋谱看就是通过模仿棋打败了腾讯的AI绝艺。另一条微博里说：“感谢Alphago最新版给我们棋界带来的震撼……若不是住院，我将用上那准备了一个星期的最后一招”。有人猜测那一招就是模仿棋。

只是，新版本的AlphaGO和去年战胜韩国顶级棋手李世石的版本相比，几乎是两个完全不同的“人”——之前 AlphaGo 提升一个版本需要 3 个月，现在只需要 1 周。AlphaGo 对阵李世石时的版本号是 V18，而当下的版本估计已经到了 V60，在逻辑上和棋局策略上已经今非昔比。

本文出自2017-05-29出版的《电脑报》2017年第21期 A.新闻周刊
(网站编辑：pcw2013)

我来说两句(0人参与讨论)

发表给力评论！看新闻，说两句。

匿名

ctrl+enter快捷提交

读者活动

48小时点击排行

论坛热帖