当前位置:首页 > 新闻资讯
【电脑报深度报道】柯洁再度告负!Alpha Go究竟有多厉害?
  • 2017/5/26 9:36:04
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:胡进
  • 作者:
【电脑报在线】“我中途觉得自己快要胜利了,内心很激动,为了让自己心跳放缓,所以摸着胸口。”


“我中途觉得自己快要胜利了,内心很激动,为了让自己心跳放缓,所以摸着胸口。”

在第二局的赛后新闻发布会上,柯洁说起了自己的“痛失好局”,“或许这就是人类和机器的区别。



5月25日13点37分,在147手之后,柯洁执白中盘再次输给了AlphaGo。这次时间更短,整个比赛用时只花了3小时零4分45秒。


要知道在比赛结束之前20多分钟,解说嘉宾古力九段还在说柯洁占优,今天很有见证历史希望,而哈萨比斯也发推说今天柯洁表现很完美。柯洁作为对战者,记者见到他也明显两眼放光,似乎看到了通向胜利的曙光,为了压抑激动情绪甚至去了一个厕所。


但想不到的是,阿尔法狗在133手的神之一手,确保可以多一枚白棋打爆黑棋。柯洁先是一愣,随后陷入了大长考,眼神也逐渐黯淡无光。“打劫的时候,柯洁打吃下错了,受到情绪严重影响了。”一位棋手评论说。


形势就这样逆转,柯洁突然认输,同声传译中传来柯洁很明显“哎”叹息声时,整个媒体室、观摩室也是一片“啊”的惊呼之声。


 “还在直播,突然就结束了,现在感觉好难过。”在Google的围棋峰会媒体群中,一位同行有着说不出的悲伤。


或许,这就是人类和人工智能的最大区别——人类总会计算错误,总会受到情绪的影响。而AlphaGo,则永远是在冰冷的机器背后, 无情而冷静的演算着属于它的胜利。


少见的轻松时刻,是在新闻发布会上,在回答记者“假若AlphaGO执棋选手不是黄士杰,而是古力,会不会情绪更为轻松时”,柯洁说“我也不知道黄士杰士怎么做到的,他不用吃饭,不用上厕所,就像AlphaGo机器坐在对面一样。要是古哥的话,我肯定会笑的更多。”这个少年天性的回答,引得了阵阵掌声。

全世界都事先认定的失败
 
5月23日16点30分,新闻发布会结束后,柯洁在几位工作人员陪同下,往国际会展中心场外走去——这原本是一场五至六个小时的围棋对决,由于AlphaGO异于人类的落子速度,时间缩短了两小时。


场馆外,是浙江乌镇磅礴了一天的江南梅雨,积水早已没过脚面。与柯洁一同随行的《电脑报》“AI与机器人(dnbai2017)”记者注意到,也许还是沉浸在与AlphaGo比赛第一局败北的失落中,柯洁打算一头扎进大雨中,所幸被人一把拉了回来。


很快,平静出现了柯洁脸上。他先是轻声询问有摆渡车没有,然后对包括记者在内的周围所有人点头微笑致意:“各位辛苦了。”


是微笑,不是苦笑。1天后,柯洁上午先是与好友、连笑八段在乌镇所属的乌村满面阳光的钓鱼、射箭、摘枇杷;傍晚时分,记者又在所住乌村的知青年代餐厅遇到了柯洁,这位19岁的围棋界第一人,与连笑和另外两位女性同伴安静享用着与记者们一样的晚餐。


5月24日,柯洁射箭放松心情

看上去,压力一朝放下,柯洁终于可以不用多去想明天(5月25日)的第二局比赛,安稳睡上一个好觉了。


两天前,5月22日决战前夜,柯洁在深夜23点25分更新了“感慨万千”的微博,字里行间满是“悲壮”,他说“无论输赢,都是自己与人工智能最后三盘对局……拼尽全力,无论结果……”


没人知道,决战前的柯洁度过了多少不眠之夜,经历了怎样的心路历程。在10多天前,他凌晨1点半发微博,给自己泡了一碗面,说:“我泡的,是寂寞。”


在外界的各种声音中,柯洁或许逐渐认识到,他是最后一个,相信自己有可能赢的希望的人了——1个月前,柯洁在微博中豪情壮志的表示“抱有必胜心态、必死信念,不会轻易言败。”


很早之前,这就是一场全世界早就认定柯洁必输的比赛。今年4月,人机大战日程敲定后,聂卫平、古力、常昊、王小川、李开复、傅盛等棋界、科技界名人都先后表示了对结果的悲观,聂卫平话说的很直接:“柯洁水平与AlphaGo差距太大,将以0比3完败。”


还有欧洲博彩业开出了盘口:柯洁获胜的赔率为1:8,即如果投10元,柯洁赢可赚到7元,而AlphaGo赢只能赚5毛。到了3月25日第二局开赛前,柯洁获胜赔率高达为1:11。


实际上,就连不懂围棋,此前也未听说过AlphaGo的乌镇人员,在记者到达乌镇的当天,也下了“人怎么可能赢得过机器”的断然结论。而在比赛过程和比赛结束后,“AI与机器人(dnbai2017)”记者在几百人的观摩厅看到,没有喧哗与议论,甚至没有太多惋惜,人们几乎都是“果然如此”的表情——尽管,柯洁看上去只是惜败。


5月23日,柯洁与哈萨比斯、施密特首次合影


回到一年前,无论是外界,还是柯洁自己,当李世石与AlphaGo人机大战之后,都把柯洁当成了守护人类智慧堡垒,也就是围棋不被人工智能彻底碾压最后的希望。 


“在沦陷之前,它塑造了柯洁,为人类围棋留下最后的尊严。”2017年2月,著名围棋记者张大勇在他与柯洁合作撰写的《梦战》一书中这样写道。这本有关第二届梦百合杯细解的书籍,名字是柯洁亲自取的,详解了柯洁在18岁时,在梦百合杯从天堂到地狱的挣扎历程。


1997年,这位当今围棋界第一人,出生于浙江丽水——或许这也是主办方将比赛场地放于乌镇这个全球知名互联网小镇原因之一。10岁时,他拿到第一个全国冠军;2008年,在中国围棋职业段位赛中成功晋级,年仅11岁即成为职业棋手。此后多次问鼎全国冠军和四个世界冠军,仅次于古力的八个。


关于他的实力,用柯洁自己的话来说就是“正式比赛中,单盘8:2碾压李世石,李世石赢的两盘没有任何作用。”一直到2016年7月18日,世界职业围棋排名网站GoRatings公布最新世界排名,AlphaGo成为新的世界第一以前,柯洁已连续24个月雄踞榜首。


但彼时,没有太多普通人知道柯洁,他在新浪微博的粉丝不到1万。那时,他的微博名叫“柯洁大棋渣”。


一切改变从2016年4月,李世石完败AlphaGo开始。李世石首场战败后,柯洁发了条微博:“AlphaGo胜得了李世石,胜不了我。”这句话,让这位少年天才成为颇受争议的超级网红,他的微博粉丝一夜间增加了数十万。


那是AlphaGo第一次公开亮相,在算法上还存在一些漏洞,也在第四局中连出数手“臭棋”,让李世石扳回一局。尽管柯洁此后称“AlphaGo超乎自己想象的强大”,但仍主动向AlphaGo下了战书:“来吧!管你是阿法狗还是阿法猫!我柯洁在棋上什么大风大浪没见过?让风暴再来的猛烈点吧!”


这位豪言壮志的少年或许还没意识到,李世石很可能将是唯一赢过AlphaGo的人类。


人类13年,不敌AI几个月
 
5月23日8点50,围棋峰会正式开幕前,柯洁第一次见到了AlphaGo之父——人工智能公司DeepMind创始人兼CEO戴密斯•哈萨比斯。


现场记者长枪短炮的包围下,在Alphabet公司(Google 母公司)董事长埃里克·施密特(Eric Emerson Schmidt)陪同下,哈萨比斯先与参与团体赛、配对赛的中国棋手握手见面。随后,在工作人员带领下,哈萨比斯与柯洁进行了简短的寒暄。这是两人的首次见面。


“机器从来就不是站在棋手的对立面。”开幕式上,哈萨比斯如此表面自己的立场,无论这次“人机大战”的结果如何,“本质上都是人类的胜利,就像人类探索哈勃望远镜一样。柯洁是一个真正的天才,相信他和AlphaGo的对弈,将开启一个新的天地。


摄像摇臂此时转到台下的柯洁,出现在大屏幕中的柯洁一脸平静。他有何感受,没人知晓。


但柯洁是有备而来的。


10点30,比赛正式开始。柯洁执黑棋先下,AlphaGo由黄世杰执白棋后下。一开始,柯洁在左上角祭出了三·3点角。这个开局由传奇围棋大师吴清源和木谷实在上世纪30年代创立,曾经流行数十年,此后在现代围棋中渐渐淡出。今年1月,化名Master的AlphaGo在一系列比赛中再次启用此开局。


柯洁模仿了它的下法,想看看对方怎么应对。一位参赛棋手对记者说,今年4月确认对决后,柯洁有意识寻找对抗AlphaGo软肋的方式,在这段期间内的8盘比赛中,柯洁尝试了很多从未用过的运子方式,面对柯洁如此的尝试和表现,业内人士评价他“越来越像AlphaGo了”。


这样的说法也得到了柯洁的印证,赛后新闻发布会上,柯洁表示,他确实选择了针对性的下法。


 这并非柯洁与AlphaGo的首次交手。今年年初,AlphaGo以Master之名在奕城和野狐两大围棋网站踢馆,以60胜1平占据碾压中日韩顶尖职业高手,唯一一次平局也是因为对手意外断开了网络连接。


柯洁也同“Master”有过交手,以落败而告终。“第一盘不知对手是谁,心态还好,后面因为知道对手不是人,心态就坏了。当时也吃不下饭,就住院了。”后来,柯洁在采访中称,人机对决给了他更大压力。


柯洁也不是第一次面对人工智能。今年3月之前,柯洁在与腾讯围棋人工智能绝艺的对弈中,拿到过四连胜,而绝艺则取得过对柯洁的13连胜,其中绝艺执白7局取得5局胜利,绝艺执黑14场取得11局的胜利。


在AlphaGo出现前,柯洁一度对认为自己已经至少掌握了围棋之道的50%,但多次被人工智能击败后,柯洁无奈地承认,自己学棋13年才达到现在这个棋艺的程度,而围棋AI从业余水平,只需几个月,就达到了人类顶尖棋手的最高水平。


目前,国际职业围棋棋手排名采取Elo等级分制度。AlphaGo的进步令柯洁感到难以置信——2016年1月击败樊麾时,它的Elo在 3000 分左右,而到4月完败李世石时,这一数值已经达到了 3500 左右。Elo从3000到3500,AlphaGo 只用了五个月,而柯洁将自己的Elo从 3300 提升至 3600,则用了将近五年。


快速提升背后,是AlphaGo全新的深度学习逻辑。这种经历迭代的深度学习逻辑,其强大力让人类难以望其项背。2016年1月,在国际顶级期刊《自然》的一篇关于DeepMind关于AlphaGo深度解析论文的封面报道。报道称,DeepMind为AlphaGo搭建了一个“将人类的直觉赋予了计算机”的神经网络——16万盘人类棋手的棋谱被输入AlphaGo,在学习了人类落子布局的特征后,它又自我对弈3000万盘,不断提高神经网络的精度。


今年3月,柯洁说,“很多棋手都对AI走火入魔了,包括我。”他研究了很多的围棋软件,对AlphaGo 过去的每一局进行了详细研究。“有一段时间,我很想向AI学一些招数,但感觉把握不好。AI对一些局面的判断和把握,我们还没有完全理解,简单模仿学习AI的招法,还不能立即有好的效果。”


在柯洁看来,“以彼之道,还施彼身”或许是自己能战胜AlphaGo的最大希望了,有人找出了柯洁的两条微博来证明:一条上说“终于用非常手段终结14连败了”,从棋谱看就是通过模仿棋打败了腾讯的AI绝艺。另一条微博里说:“感谢Alphago最新版给我们棋界带来的震撼……若不是住院,我将用上那准备了一个星期的最后一招”。有人猜测那一招就是模仿棋。


只是,新版本的AlphaGO和去年战胜韩国顶级棋手李世石的版本相比,几乎是两个完全不同的“人”——之前 AlphaGo 提升一个版本需要 3 个月,现在只需要 1 周。AlphaGo 对阵李世石时的版本号是 V18,而当下的版本估计已经到了 V60,在逻辑上和棋局策略上已经今非昔比。


更可怕的是,AlphaGo已可以控制胜率了?

 

柯洁认输
 
“以彼之道,还施彼身”带给柯洁的,只是比赛前半段的短暂轻松。很快,柯洁开始变得明显有些犹豫,多次拿起黑棋又放下,并时不时抓头发、皱眉、托晒、摇头,脸上不时露出“诡异”笑容,不知道是苦笑还是微笑。
 
相比之下,AlphaGo落子速度飞快,柯洁用时约80分钟思考后,AlphaGo才用时约20分钟,有些棋子甚至是“秒下”,但落子结果却在不停地给柯洁出难题,一番勾心斗角之后,都是AlphaGo更占优势。


围棋专家们早已看到了结局,记者在午餐偶遇讲解员常昊时,常昊就表示,“柯洁明显和AlphaGo差距很大,在开局不久就已经落后了,AlphaGo的布局构思远胜于人类。”


第一场比赛,柯洁和执棋的黄士杰没有吃午饭,四个小时之内上了几次厕所。


或许,在全世界都认定必输局面情况下,胜负已经不是人机大战第二季的主要看点。


“人工智能不是对手,可以成为朋友。我们看看它的极限究竟在哪里。”古力在发布会开始前表示。


只是,想要看到AlphaGo的极限并不容易。5月24日,DeepMind首席科学家大卫·席尔瓦(David Silver)透露称,目前的AlphaGo,比去年战胜李世石的那一版要“强三子”:“AlphaGo成为自己的老师,它从自己的搜索里学习,有着更强大的策略和价值网络。”


也就是说,按照围棋等级划分,现在AlphaGo 的积分为4500分左右,遥遥超越所有人类,目前暂列人类职业棋手第一位的的柯洁积分为3620分。


此言一出,四座皆惊。虽然此前也有过类似传闻,但这一次却是实实在在从DeepMind首席科学家口中说出。柯洁立刻发了一条微博:“早就听说新版AlphaGo的强大……但……让……让三个?我的天!”他解释说,这个差距有多大呢,就像武林高手对决让人先捅三刀。


尽管此后DeepMind团队的樊麾二段发表声明称,“当AlphaGo与从未对弈过的人类棋手对局时,这样的优势就不复存在。”不过,这并不能掩盖AlphaGo的种种可怕。 


更可怕的,或许还是如今版AlphaGo强大的自我迭代和更新能力,在算法上,这一版本的 AlphaGo 已经不需要外在“导师”,能实现自我学习了。


早期,AlphaGo仍通过学习六段以上的围棋选手下法来进行学习,但如今与去年相比,2.0版的AlphaGo将正式摒弃人类棋谱,只靠计算机自身深度学习的方式成长。即通过数学模型下的自我对弈和深度学习,下出完全属于人工智能(AI)的围棋。


搜狗总裁王小川称,此次AlphaGo可能已经放弃了监督学习,也就是说不再依赖原先人类的3000万局棋谱,甚至有可能放弃了蒙特卡洛树搜索,大大减少了暴力计算,落子速度更快、准确率更高。两台没有棋谱数据的AlphaGo自我对战学习如何下棋,并达到登峰造极的地步,只需要一周的时间。


换句话说,就是“AlphaGo已经是自己的导师”,甚至于它已经不满足于只是单纯取得胜利,而是控制胜利的概率以及输赢的差距——根据举个通俗的例子:90%赢10目和100%赢1目,AlphaGo一定会选择赢1目的变化,因为胜率更高。这也是AlphaGo在早早掌控巨大优势,后盘一路放缓脚步的原因。


这个说法得到了哈萨比斯等人某种程度上的认可。“我们的确在研究如何通过多线路决策来扩大胜率,甚至是去控制胜率,这是我们的一个探索方向。” 哈萨比斯说,他们的确在测试AlphaGo获取胜利的程度。

从此以后,人机大战或许再无意义
  
“此次出战的AlphaGo是单机版,比李世石对弈的版本要高出十倍,以计算量仅需原来的十分之一,训练时间也从几个月缩减到了几个星期。”哈萨比斯说,目前的AlphaGo是在云端由单TPU运行,与李世石对战的AlphaGo在云上有50个TPUs在运作,搜索50个棋步为10000个位置/秒,而5月23日打败柯洁的AlphaGoMaster则在单个TPU上进行游戏。TPU是专门为机器学习而设计的处理器。
 

棋手张璇和常昊夫妇现场讲解


如果说之前的AlphaGo还依赖于大量的数据的计算,那么进化后的AlphaGo几乎就像是一个真正深谙围棋艺术的天才。柯洁说,和AI下棋时就像“安乐死”,AI的许多招法不仅超乎人类想象,甚至它在保证胜利的前提下还可以给人类一个“体面”的输法。
 
“数千年以来,历史留下了关于围棋的无数玩法和总结,计算机却告诉我们人类全都是错的。”柯洁的话语中,是掩饰不了的凄凉。
 
自古以来,人类就对于这个19x19的棋盘迷恋不已,361个交叉点、150回合对弈,看似规则简单,却可以变幻出超越宇宙原子总数的可能。没人知道,柯洁这个人类围棋智慧堡垒最后守护者的失利,对中国围棋界和围棋的未来,意味着什么。
 
“AI肯定会越来越厉害,将来人肯定下不过它们。但是这就像人终究是要死的,难道你今天就去寻死,就不活了吗?”国家围棋领队、棋手华学明说, “这个阶段对棋手是非常痛苦的,尤其是完全沉浸在胜负中的年轻棋手,围棋就是他们的生命。”
 
在接受《南方人物周刊》采访时,古力感叹,“我对科技产生了一种敬畏感,仅次于对大自然的敬畏。”“黑暗是你的朋友,绝望是你的领路人,”古力把这句话抄在本子上,“特别能体现我们棋手的心境。”他说自己记得最清楚的都是输棋,但那些“输了跟谁都不想说话的”黑暗经历都无法与AI带来的绝望相比。
 
但显然,即便AlphaGo再厉害,它也只能得到柯洁的尊重,而非喜爱,在那篇战前发表的微博长文中,柯洁写道:“与人类相比,我感觉不到它对围棋的热情和热爱。对它而言...它的热情——也只不过是运转速度过快导致CPU发热罢了。”
 
他赞叹人工智能的未来,“如果AI真能造福人类的话,我们的尊严根本算不上什么。有时候也会觉得我们其实是幸运的,首当其冲被AI冲击和改变,未来如何被AI改变,我们的体会要比普通人更深一点。”他也在新闻发布会上再次明确表示:“这是我最后三盘和人工智能对战,我还是喜欢和人下棋。”


今年3月底,柯洁做客央视一套《朗读者》节目,朗读了《哈利波特与死亡圣器》的最后一个节选,内容是哈利波特与伏地魔第一次也是最后一次正面对决。他说要将这段朗读献给来自未来的对手。当时,柯洁已经决定正式应战AlphaGo,但对阵的时间地点尚未确定,其寓意不言自明。

“ 哈利早就知道会这样了,他知道他的身体不会这样一直静静地躺在森林的地面上,为了证明自己的胜利,伏地魔一定会去践踏、侮辱他的遗体……”


本文出自2017-05-22出版的《电脑报》2017年第20期 A.新闻周刊
(网站编辑:cqemao)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖