围棋人机大战背后与人工智能发展课件.ppt
《围棋人机大战背后与人工智能发展课件.ppt》由会员分享,可在线阅读,更多相关《围棋人机大战背后与人工智能发展课件.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、12023/2/16围棋人机大战的背后与人工智能发展趋势刘知青 北京邮电大学教授、计算机围棋研究所所长(注:本文由刘教授于2016年4月在围棋TV上的发言整理而成)2 报告提纲什么是本次围棋人机大战的看点?为什么是围棋问题?AlphaGo是如何解决围棋问题的?如何展望围棋人机大战之后的人工智能?32023/2/16樊麾,与围棋人机大战的赛前预测AlphaGo开发过程:1)项目正式开始于2014年2)2015年7月已完全超越现有AI3)2015年10月已5:0战胜了樊麾4)2016年1月完全超越了普通职业棋手樊麾的提示:说我棋臭的,我承认,确实棋臭42023/2/16李世石,与围棋人机大战的结果
2、李世石完败李世石赢的一盘也是因为AlphaGo在大幅领先局势下的失误AlphaGo在展现强大力量的同时,也暴露潜在的问题和弱点52023/2/16柯杰,与围棋人机大战的看点不是普通意义上的挑战比赛,更是公司内部的系统测试AlphaGo展现了独特的围棋风格优秀的大局观和强大的总体把握能力简明直接的局部定型,虽非最优,但瑕不掩瑜算法仍然存在弱点,还有很大改进空间柯杰:“就算AlphaGo战胜了李世石,但它赢不了我”62023/2/16为什么是围棋?最复杂(注:状态复杂度与博弈复杂度)的智力游戏:看似简单,实为复杂,具有10的170次方状态复杂空间。涉及逻辑推理,形象思维,优化选择等多种人类智能(注
3、:国际象棋只有逻辑推理,没有形象思维)公认是人工智能领域长期以来的重大挑战国际学术界曾经普遍认为解决围棋问题需要15-20年时间72023/2/16AlphaGo的核心方法由于天文数字的状态空间和搜索空间,蛮力计算无法解决围棋问题(注:解决国际象棋的IBM深蓝是用蛮力方法,就是靠计算,这种方法在围棋这么大的计算与搜索空间是无法进行的)围棋职业棋手的解决方法:棋感直觉+搜索验证AlphaGo的核心方法完全类似于完全职业棋手的解决方法AlphaGo的优势:完全以胜率为目标,不受任何其它因素影响82023/2/16深度神经网络:棋感直觉棋感直觉,是高水平围棋对弈的要素反应了职业棋手长期学习、训练、对
4、弈的经验积累AlphaGo通过深度神经网络机器学习,获得围棋棋感直觉,并且训练强度远超出任何棋手的个人能力(注:有的围棋对弈软件如:Zen,没有棋感直觉,每走一步软件是硬写上去的,这个是规则,不是棋感直觉。规则的覆盖面非常小,围棋的变化太多)(训练两个网络,policy network走子网络和value network估值网络)92023/2/16102023/2/16策略网络:落子棋感深度神经网络的有监督学习学习职业棋手和业余高段棋 手的棋谱(数十万份棋谱,上亿数量级的落子方式)获得在围棋盘面下的落子棋感112023/2/16价值网络:胜负棋感深度神经网络的增强型学习(DeepMind独创
5、)通过自我博弈,学习不同盘面下的胜负情况(三千万盘自我对局)获取在围棋盘面的胜负棋感(注:对每一个落子点给一个当时的快速的胜负感(估算),这个胜负估算并不是根据分析计算出来的,而是直觉)(通过AlphaGo几千万盘的训练学习得来的)122023/2/16132023/2/16蒙特卡洛树搜索:搜索验证没有棋感直觉不行,完全依赖棋感直觉也不行直觉需要通过严格的数学模型和计算方法,对棋感直觉进行验证AlphaGo使用蒙特卡洛树搜索,对落子棋感和胜负感进行计算验证。142023/2/16蒙特卡洛树搜索152023/2/16蒙特卡洛模拟采样:胜负棋感验证基于数学期望的胜负评估模型(胜率)基于蒙特卡洛模拟
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 围棋 人机 大战 背后 人工智能 发展 课件
限制150内