AlphaGo之父:选围棋因其复杂性 盼与柯洁探索真谛

北京时间5月24日乌镇围棋峰会展开了以人工智能科技发展为主题的科技论坛。此次论坛上deepmind团队负责人哈萨比斯和AlphaGo首席程序员david silver共同为在场嘉宾媒体讲解了人工智能如何解决人类世界的难题以及如何学习和被训练。
哈萨比斯在提到去年的人机大战时说他们等待自己的人工智能战胜李世石那一刻等了10年,根据他们统计的数据去年总共有2.8亿观众观看了现场直播、3.5万篇相关报道,而围棋棋盘在西方世界的销售量增加了10倍。
在说到为什么选择围棋作为AlphaGo的挑战领域时,哈萨比斯表示围棋不仅仅是个游戏,它是一种很客观的艺术,并且围棋棋盘能衍生出的变化非常多,这很有可让AlphaGo穷举其搜索能力。此外,围棋没有等级差别 ,每个棋子都是一样的,而每一个棋子的变化都有可能改变最后的结果,因此机器必须拥有强大的计算全局的能力。David sliver则表示围棋是历史最悠久的一项游戏,也是构建和理解运算的最佳试验台。
在AlphaGo学习和自我训练上,David介绍了他们目前所使用的两种模式:策略网络和价值网络,策略网络需要通过监督学习来实现,它能够通过位置的变化发现更多的可能性,最终达到的价值网络则需要自我强化,以实现更好的评估的目的。
David在提到去年alphago的版本和今年与柯洁比赛的AlphaGo的最新版本时说,去年的AlphaGo在云端使用了50个TPU进行运算,而今年的AlphaGo已经可以实现单个TPU进行独立运算了。也就是说今年的AlphaGo比去年的AlphaGo还要强3子。
哈萨比斯最后表示,3000年来从来没人创造出完美的棋局,而AlphaGo能够让人们探索围棋的奥秘,他希望柯洁能与AlphaGo共同探索围棋的真谛。
值班主任:贺燕




















