谷歌围棋让俞斌改变看法 江铸久:它或许遇强则强

作者:小石点击:422682016-02-26 18:12

  新华社记者王镜宇

  2月22日,由谷歌公司的团队研发的计算机围棋程序“阿尔法围棋”将和前世界围棋第一人李世石展开五番棋挑战的消息正式发布,这场备受瞩目的围棋“人机大战”迅速升温。究竟是拥有人工智能的计算机攻克人类智力运动的“最后堡垒”,还是李世石捍卫人类智力的荣誉?不管会不会下围棋,人们都想知道这个问题的答案。

  围棋是目前世界上难度最大的智力游戏。仅仅两个多月以前,计算机围棋程序战胜顶尖人类围棋手的道路看上去还很漫长。在北京举行的美林谷杯首届世界计算机围棋锦标赛中,来自韩国的著名程序“石子旋风”夺得冠军。但是,在随后进行的一场和中国围棋名人连笑七段的“人机大战”中,“石子旋风”受四子和五子连败两阵,被打到让六子之后才险胜一盘。以“石子旋风”的表现为参照,计算机程序要想复制当年“更深的蓝”击败国际象棋世界冠军卡斯帕罗夫的伟业犹如痴人说梦。

  然而,2016年1月底,突然传来令人震惊的消息:此前不为人所知的程序“阿尔法围棋”在另一场“人机大战”中5:0大胜欧洲冠军、樊麾二段,成为有史以来第一位战胜围棋职业选手的计算机程序。更可怕的事,这个据说拥有“学习能力”的程序和樊麾的比赛是去年10月进行的,因为配合《自然》杂志的发表才推迟了公布时间。从去年10月到现在,电脑的围棋水平还有可能进一步提升。

  要知道“阿尔法围棋”到底有多厉害,樊麾是目前最重要的参照物。虽然樊麾拥有职业二段的称号,但他多年不在围棋中心地中、日、韩参与一线赛事,大约是胡煜清这样顶尖业余高手的水平。职业棋手李喆表示,根据多数职业棋手的判断,从“阿尔法围棋”在“人机大战”中的表现来判断,他大约是顶尖棋手让先至让先倒贴之间(即两子以内)的水平。

  即便如此,计算机围棋程序的进步速度也令人感到恐怖。横空出世的“阿尔法围棋”一举成为当今最厉害的计算机围棋程序。与受六子险胜连笑的“石子旋风”相比,它的实力上升了三、四个子,这在计算机围棋领域无疑是巨大的飞跃。

  中国围棋队总教练俞斌对计算机颇有研究,自己还为国家队的管理写过程序。去年11月,他曾经表示有生之年很难看到计算机围棋程序战胜人类。可是,“阿尔法围棋”战胜樊麾的棋谱面世之后,俞教头的想法有了很大变化。

  “我觉得他们是找到了质的飞跃,但是现在我们还蒙在鼓里。我看了很多相关的资料,他们弄得有些神秘,我非常想知道其中的奥秘,这真是个‘谜’啊!”

  俞斌表示,对于一个程序员而言,万变不离其宗,最重要的是数据结构和算法。但是,从现有的资料来看,他还无法判断“阿尔法围棋”用的是什么样的新算法。据他猜想,可能是在模式识别、图形识别或者模型匹配方面实现了重大优化。

  北京邮电大学教授刘知青是国内计算机围棋的专家。据他介绍,最近10年蒙特卡洛树搜索技术和机器学习技术的发展加快了计算机围棋的发展进程。去年10月,他就在计算机世锦赛发布会上乐观地表示,电脑在围棋项目上战胜人类的那一天,在座的有生之年应该可以看到。

  据刘知青分析,“阿尔法围棋”之所以这么厉害是应用了“深度神经网络”技术,大大提高了蒙特卡洛树搜索的质量。谷歌的研究团队中有很多人都是相关领域的大家,这次爆发的背后也有他们多年的深厚积累。

  对计算机围棋技术的发展,刘知青始终充满信心。不过,在记者请他预测李世石和“阿尔法围棋”的“人机大战”的结果时,他说这只能是“盲人摸象”。

  “如果一定要摸的话,我觉得机器的胜面更大一点?”

  卡耐基梅隆大学机器人系博士田渊栋是脸书(FACEBOOK)人工智能组研究员、脸书智能围棋程序黑暗森林(DARKFOREST)的负责人和第一作者。

  据田渊栋介绍,谷歌的研究团队起步早、投入大、动作快,而他自己是在2015年5月份看到他们在2014年投稿的论文之后,才开始做“黑暗森林”。如今,“黑暗森林”已经达到业余五段的水平,今年1月参加KGS(著名的网络围棋服务器)的月度计算机围棋程序锦标赛时名列第三。如果不是当时出现了技术失误,很可能要拿冠军。

  田渊栋在“知乎问答”中说,“阿尔法围棋”的开发团队训练了一个走子的神经网络,又训练了一个可以评估局面的网络,然后在蒙特卡洛树搜索中同时使用这两个网络,后者用了两千万局的自我对局的结果训练。总之,谷歌团队的做法充分利用了大数据加深度学习的优势,而几乎完全没有用到围棋领域的知识。“若是以后棋力能再往上走,我也不会惊讶。”

  在被问到即将展开的“人机大战”的结果时,田渊栋谨慎地表示“不好说,我也很期待”。

  曾经获得过14个世界冠军头衔的李世石是这次人机大战的主角。他说,观看了“阿尔法围棋”与欧洲冠军此前的对局棋谱后,他认为人工智能还没达到跟他争胜负的水平。“尽管人工智能学习能力强,实力会有所提升,但它的水平大概是我让先的水平,”李世石说,“5盘棋应该不会是3:2,可能是4:1或5:0,我会赢。”

  世界棋坛风头最劲的新锐、18岁就已手握3个世界冠军头衔的柯洁则预测说,李世石将以5:0击败“阿尔法围棋”。但他也提到:“据说电脑每时每刻都在学习,就在我们打电话这会儿可能都在进步,所以不知道到时候会是一个什么状态,不过不出意外的话,应该还是李世石获胜。”

  包括柯洁、俞斌在内,很多职业高手认为这次的“人机大战”还是李世石的赢面大。而曾经旅美的著名国手江铸久却认为,李世石未必会赢得那么容易。

  当年旅居美国期间,江铸久结识了美国数学家埃尔温·伯利坎普,又通过他接触到美国研究智力运动计算机程序的圈子,对于计算机围棋程序的发展进程非常熟悉。他说,几年以前,美国的一些计算机专家就认为蒙特卡洛树搜索的出现让计算机在围棋项目中战胜人类成为可能。当时之所以不行,是因为研究力量不集中,还有经费的问题。最近几年,神经网络和大数据发展迅速,而谷歌研究团队的优势在于他们技术的强大和对神经网络的应用。

  在江铸久看来,“阿尔法围棋”的厉害之处在于它对人脑思维的模仿。职业棋手可能会忽略的一点是,“阿尔法围棋”的表现可能具有“遇强愈强”的特点。以樊麾作为参照物,并不一定能完全反映“阿尔法围棋”的真正实力,因为对手还不够强。

  江铸久说:“李世石和电脑下的是五番棋,前三盘我不看好电脑,但是电脑很可能会越来越厉害。”他半开玩笑地表示,愿意开盘赌电脑赢第五盘。江铸久还说,虽然“人机大战”是五番棋,但实际上只要电脑赢一盘就相当于是电脑赢。

  “只要电脑赢一盘,电脑超过人类的时间点就已经到了。现在是职业高手和业余棋手下‘多面打’,将来可能会是电脑跟职业高手下‘多面打’。”

网友评论(0条)