AlphaZero:通用型的棋类人工智能程序
来源:消费保  时间:2019年02月21日 作者:张某某 

  今年,Deepmind的“AlphaGo”在围棋领域的胜利让不少人了解到人工智能的强大。当时有人还认为没有人类棋手的经验,人工智能很难快速达到如今的成绩,但后来推出的AlphaGo Zero却是从0开始,自己学习围棋,又取得超越AlphaGo的成绩。如今Deepmind再次将这种强大的算法泛化,提出了AlphaZero:一种可以从零开始,在多种不同的任务中通过自我对弈,达到超越人类水平的新算法。这种算法可以通过24小时的对弈训练后,就可以在日本将棋和国际象棋领域击败目前业内顶尖的计算机程序(这些程序早就战胜了人类棋手)。以下是AlphaZero取得的成绩:

  8小时自我训练战胜李世石版本AlphaGo;12小时自我训练战胜世界顶级国际象棋程序Stockfish;14小时自我训练战胜世界顶级将棋程序Elmo。

  国际象棋算法的历史和计算机一样古老,虽然很多计算机大师在很久以前就开始了国际象棋算法的开发,但众所周知,国际象棋算法仍然花费了很久才战胜了人类。国际象棋算法存在一个问题,就是它只能在国际象棋领域起作用,如果不经过大幅改造,这个算法是完全不能在其他领域其作用,而大幅改造又失去了利用这一算法的意义。

  创造一个规则简单但能在不同领域应用的算法一直是人工智能领域的重要课题。AlphaGo Zero就是一种使用卷积神经网的算法,它可以只通过强化学习进行自我对弈训练,也就是只通过输入围棋规则就能达到超越人类的水平。而新开发的AlphaZero则是能在其他领域获得同样的成绩,在没有输入除了规则以外的任何信息的情况下,AlphaZero仍然可以通过自我学习取得战胜人类顶尖选手的成绩。

  1997年“深蓝”击败人类世界冠军卡斯帕罗夫,从那以后计算机程序的国际象棋水平一直在人类之上。这些程序必须得按照人类大师仔细调整的权重来计算落子的优劣。在日本将棋领域,计算机程序的进展就更为缓慢了,日本将棋棋盘更大,而且被吃掉的棋子可以改变阵营,重新上场,还能被放置在大部分位置上。正是因为这些原因,知道2017年计算机程序才在日本将棋领域战胜人类冠军。而围棋的规则是相对比较简单的,适合AlphaGo中的神经网络体系结构。

  这三种棋有着很大的区别,从基础构架来说并不兼容,如果让AlphaGo去学习日本将棋和国际象棋是很困难的。但是AlphaZero却不但能完胜其他程序,还能用更少的计算量实现胜利。(王蔚)

派遣劳务公司



















【免责声明】:YY维新网发布此信息目的在于传播更多信息,与本网站立场无关。YY维新网不保证该信息的准确性、真实性、完整性、有效性等。相关信息未经过本网站证实,不构成任何投资建议,据此操作,风险自担。
推荐文章
  YY维新网免费提供的行情数据以及其他资料均搜集整理自互联网,仅作为用户获取信息之目的,并不构成投资建议。YY维新网不为本页面提供的信息错误、残缺、 延时或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎       最后修改时间:2019-10-30 08:26:09
Copyright © 2018 www.yyweixin.cn All Rights Reserved 浙ICP备888888号-4  横岗镇镇金龙工业区劳务派遣公司黄贝劳动力市场 快递行业准 上海今年发 小学骨干教 分析报告显 立法推进国 新四军老战 标准商务日 迎接建军8 驻沪部队加 本市互联网