语文教学网 加入收藏  -  设为首页
您的位置:语文教学网 > 知识 > 正文
人工智能阿尔法围棋用了哪项新技术
人工智能阿尔法围棋用了哪项新技术
提示:

人工智能阿尔法围棋用了哪项新技术

阿尔法围棋用到了很多新技术,如神经网络、深度学习、蒙特卡洛树搜索法等,使其实力有了实质性飞跃。美国脸书公司“黑暗森林”围棋软件的开发者田渊栋在网上发表分析文章说,阿尔法围棋系统主要由几个部分组成: 1、策略网络(Policy Network),给定当前局面,预测并采样下一步的走棋。 2、快速走子(Fast rollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍。 3、价值网络(Value Network),给定当前局面,估计是白胜概率大还是黑胜概率大。 4、蒙特卡洛树搜索(Monte Carlo Tree Search),把以上这四个部分连起来,形成一个完整的系统。 “阿尔法狗”采用的是利用“价值网络”去计算局面,用“策略网络”去选择下子。阿尔法狗依旧处于一个弱人工智能的水平。什么是弱人工智能?简单的说,所谓弱人工智能就是仅在单个领域比较牛的人工智能程序。 比如我们熟悉的苹果Siri,就是一个会卖萌的弱人工智能程序。而阿尔法狗根据这个标准,依旧在这个范围以内。充其量,最多是人类围棋的陪练。而这场人际对决,本质上更像是谷歌的一场科技秀。 阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。 2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2016年末2017年初,该程序在中国棋类网站上以“大师”(Master)为注册账号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩。 2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平,在GoRatings网站公布的世界职业围棋排名中,其等级分曾超过排名人类第一的棋手柯洁。 2017年5月27日,在柯洁与阿尔法围棋的人机大战之后,阿尔法围棋团队宣布阿尔法围棋将不再参加围棋比赛。2017年10月18日,DeepMind团队公布了最强版阿尔法围棋,代号AlphaGo Zero。 2017年7月18日,教育部、国家语委在北京发布《中国语言生活状况报告(2017)》,“阿尔法围棋”入选2016年度中国媒体十大新词。

人工智能击败欧洲围棋冠军,AlphaGo 究竟是怎么做到的
提示:

人工智能击败欧洲围棋冠军,AlphaGo 究竟是怎么做到的

 因为程序改进过,采用了深度学习的算法,选点,大局观的判断有了不小的进步。也修复了以前的bug,棋力有了突破性提高,
  此外,Google给该软件投入了巨资,给与最好的硬件,极大的提高了他的计算能力。
  从人工智能技术发展上看,DeepMind使用了“深度学习”技术,而非象俞斌估计的和职业高手合作。电脑通过海量学习人类高手的棋谱,用深度神经网络快速模拟出人的招法,下出来的棋就很象人了。樊麾二段说:“如果没人告诉我,我会想对手下得有一点怪,但肯定是个很强的棋手,一个真正的人”。
  而DeepMind小组在搜索技术上取得了更大突破。跟Darkforest相似,AlphaGo用一个深度神经网络(policy network,“策略网络”)减少搜索的选点,象人类高手一样,只考虑少数几个可能的选点。此外,他们还建立了另一个深度神经网络(value network,“值网络”),象人类高手一样,思考到某个局面就有了结论,不必象之前的蒙特卡洛模拟那样下到终局,极大地减小了搜索的深度。
  DeepMind引入的另一个逆天的高招是,让围棋人工智能自己和自己下,总结经验,自我不断提高!
  这个人工智能自学习的要点是,不需要告诉电脑人类的经验,就让它自己玩这些电脑游戏,只是给出玩的分数。电脑看着分数不断纠正自己的策略,最后就发展出比人类还强的电游技术。这次的AlphaGo也用了这个技术,这又是比其它电脑围棋程序强的地方。
  通过这样三招,DeepMind小组确实在围棋人工智能上取得了巨大突破。而且研究方法的潜力很大,从这个方向上走,最终象“更深的蓝”一样战胜人类最高手是完全可以想象的。一个月前,DeepMind小组就报告说围棋人工智能取得了巨大突破,会战胜人类,但当时棋迷与职业棋手并未留意。现在有了棋谱,又有了技术细节,就显得可信多了。