阿尔法狗再进化 可通过自我对弈进行学习
0阅读
太平洋电脑网
2017-10-19 13:07:07
谷歌旗下人工智能研究部门DeepMind发布了新版AlphaGo(阿尔法狗)软件,它可以完全靠自己学习围棋。这款名为AlphaGoZero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。
10月19日消息,谷歌旗下人工智能研究部门DeepMind发布了新版AlphaGo(阿尔法狗)软件,它可以完全靠自己学习围棋。这款名为AlphaGo Zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。
经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。
结果表明,具体到不同技术的效果,人工智能在这一领域仍有很多学习的空间。AlphaGo Master使用了很多与AlphaGo Zero相同的开发技术,但它需要首先利用人类的数据进行训练,随后才切换成自我对弈。
值得注意的是,虽然AlphaGo Zero在几周的训练期间学会了一些关键概念,但该系统学习的方法与人类有所不同。另外,AlphaGo Zero也比前几代系统更加节能,AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。
编辑:私念
免责声明本站发布此文目的在于促进信息交流,不存在盈利性目的,此文观点与本站立场无关,不承担任何责任。部分内容文章及图片来自互联网或自媒体,我们尊重作者版权,版权归属于原作者,不保证该信息(包括但不限于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等。未经证实的信息仅供参考,不做任何投资和交易根据,据此操作风险自担。
- 最新报价
- 最新资讯
- 热门报价
- 1.(2022年08月25日)建设银行龙鼎金条今日多少钱一克
- 2.今日中行金条价格多少钱一克(2022年08月25日)
- 3.(2022年08月25日)建行纸白银价格最新行情查询
- 4.今日最新白银td价格走势查询(2022年08月25日)
- 5.最新铂金价格今天多少一克(2022年08月25日)
- 6.足金回收今天多少钱一克(2022年08月25日)
- 7.(2022年08月25日)狗年150克纪念金币价格多少
- 8.2019年熊猫金币价格多少钱一克(2022年08月25日)
- 9.今天周生生金条价格多少钱一克(2022年08月25日)
- 10.今日上海老庙金条价格多少钱(2022年08月25日)