AlphaGo创始人:李世石帮助我们寻找缺点

腾讯科技讯(孙宏超)北京时间3月13日下午4点44分,人机大战五番棋大战第四场结束,世界围棋冠军李世石执白在第78手下出“神之一手”战胜AlphaGo,在五局比赛中首次获胜,但总比分仍以1比3落后。双方的第五场比赛将于下周二中午12时举行。

针对此次李世石的胜利,AlphaGo创始人哈萨比斯表示李世石再次向大家证明他是一个传奇:“李世石是一个出色的棋手,他对于AlphaGo表现的非常好,AlphaGo最开始的时候表现的还是不错的,我们以为他会在中盘的时候非常好,但是因为李世石给我们的AlphaGo带来很大的压力,所以说最后他没有表现好。但是我们非常高兴,这就是我们来到这的原因,我们要测试AlphaGo的极限,找到AlphaGo有没有什么样的弱点,通过这样的方式我们在能够不断的改善我们的程序。”

哈萨比斯还表示:“AlphaGo一开始它是自己跟自己比赛,然后进行学习,这就意味着他有可能知识上还有缺陷,但是我们之前是没有合适的棋手帮我们找到这个缺陷,我们来到这里就是要找到一个很好的棋手帮助AlphaGo找到他的缺陷。李世石先生的确推动了AlphaGo展现了自己的缺点,对于我们来讲这是非常有价值的。”

此外,现场解说嘉宾麦克雷蒙表示这是一场有趣的比赛:“在比赛的中间部分,就是78手下李世石下的非常好,而且我有点惊讶。我想多数的对手都会感到惊讶,特别是AlphaGo也感到惊讶,这样的一手实际上最终达到了中腹这部分能够获胜,这就是展现了李世石很有实力。”

针对AlphaGo在专业人士看来是错误的的问题,哈萨比斯回应称AlphaGo是原型的程序:“没有到beta程度,只是在阿尔法阶段,因此我们就是要来看一看他有什么样的缺点,得在真正的围棋比赛当中看到这一点。李世石是顶尖棋手,能够帮助我们找到这样的缺点,因此我们的确打了一场非常不错的比赛。医疗是不一样的东西,我们要更进一步的测试这个软件,我们这样一个软件是在原型的阶段,所以我们来到这里进行测试,这就是我们现在的情况。”

针对AlphaGo头一次认输的问题,哈萨比斯回应称:“AlphaGo通过计算胜利的可能性选择有哪一手,要增加胜利的可能性,如果胜利的可能性低于阈值的话就认输,它会告诉操作员。AlphaGo是跟人一样认输的。AlphaGo总是认为他的对手可能下出最好的手,所以说他这样的计算就是要增加他最有可能胜的这样一些胜率,就是他这一手跟他的原则是一致的,不管对手是什么样的水平。”

在比赛中有评论称李世石和AlphaGo信息不对称,对此哈萨比斯回应称:“AlphaGo不是针对李世石来进行训练的。我们用人类的棋局来培训它的,主要是从互联网上下载了一些业余的棋谱对它进行训练,这些都是日常开展的。我觉得AlphaGo是通过自我的学习,不断的对弈,来不断的成长的。我们并没有专门就李世石对它进行培训。即使我们想要针对李世石对它进行培训的话,AlphaGo也需要几百万的棋局对它进行培训,如果只是100场是没有办法对它进行很好的培训的。因为它是需要几百万,上亿的培训。”

3 收藏


直接登录

推荐关注