YY维新网-AlphaZero：通用型的棋类人工智能程序

首页 » 债券

AlphaZero：通用型的棋类人工智能程序

来源：消费保　时间:2019年02月21日作者：张某某　

　　今年，Deepmind的“AlphaGo”在围棋领域的胜利让不少人了解到人工智能的强大。当时有人还认为没有人类棋手的经验，人工智能很难快速达到如今的成绩，但后来推出的AlphaGo Zero却是从0开始，自己学习围棋，又取得超越AlphaGo的成绩。如今Deepmind再次将这种强大的算法泛化，提出了AlphaZero：一种可以从零开始，在多种不同的任务中通过自我对弈，达到超越人类水平的新算法。这种算法可以通过24小时的对弈训练后，就可以在日本将棋和国际象棋领域击败目前业内顶尖的计算机程序（这些程序早就战胜了人类棋手）。以下是AlphaZero取得的成绩：

　　8小时自我训练战胜李世石版本AlphaGo；12小时自我训练战胜世界顶级国际象棋程序Stockfish；14小时自我训练战胜世界顶级将棋程序Elmo。

　　国际象棋算法的历史和计算机一样古老，虽然很多计算机大师在很久以前就开始了国际象棋算法的开发，但众所周知，国际象棋算法仍然花费了很久才战胜了人类。国际象棋算法存在一个问题，就是它只能在国际象棋领域起作用，如果不经过大幅改造，这个算法是完全不能在其他领域其作用，而大幅改造又失去了利用这一算法的意义。

　　创造一个规则简单但能在不同领域应用的算法一直是人工智能领域的重要课题。AlphaGo Zero就是一种使用卷积神经网的算法，它可以只通过强化学习进行自我对弈训练，也就是只通过输入围棋规则就能达到超越人类的水平。而新开发的AlphaZero则是能在其他领域获得同样的成绩，在没有输入除了规则以外的任何信息的情况下，AlphaZero仍然可以通过自我学习取得战胜人类顶尖选手的成绩。

　　1997年“深蓝”击败人类世界冠军卡斯帕罗夫，从那以后计算机程序的国际象棋水平一直在人类之上。这些程序必须得按照人类大师仔细调整的权重来计算落子的优劣。在日本将棋领域，计算机程序的进展就更为缓慢了，日本将棋棋盘更大，而且被吃掉的棋子可以改变阵营，重新上场，还能被放置在大部分位置上。正是因为这些原因，知道2017年计算机程序才在日本将棋领域战胜人类冠军。而围棋的规则是相对比较简单的，适合AlphaGo中的神经网络体系结构。

　　这三种棋有着很大的区别，从基础构架来说并不兼容，如果让AlphaGo去学习日本将棋和国际象棋是很困难的。但是AlphaZero却不但能完胜其他程序，还能用更少的计算量实现胜利。（王蔚）

派遣劳务公司

【免责声明】：YY维新网发布此信息目的在于传播更多信息，与本网站立场无关。YY维新网不保证该信息的准确性、真实性、完整性、有效性等。相关信息未经过本网站证实，不构成任何投资建议，据此操作，风险自担。

全网热点

春节碰撞创意外籍创业者深圳过大年深圳图书馆新春期间为读者带来丰富文化活动广西玉林志愿服务温暖摩托车返乡青年除夕，夫妻双双守国门春节旅游大数据:北京人爱迪士尼东北人爱来这里北京除夕五环内全面禁放烟花爆竹致伤同比降42% 除夕夜飞驰列车上的亲情通话国家发改委下达8亿元中央预算内投资扶持人口较少民族发展我国高等教育入学机会更公平人才选拔更科学规范涪陵研学游大年初一受热捧别样春节假期亲子乐参考消息刊文：习近平四川行细节感人至深中国浓浓年味飘向全世界春节再成外媒焦点军官在亚丁湾抓3名海盗缴3支冲锋枪由排长升连长全面禁放烟花北京五环内除夕“零伤情”、“零火情” 北京海淀:愉快的除夕夜

舆情热点

渝北区全面深化行政审批改革取得实效云阳县狠抓“三链”推进“枣”扶贫成效显著九龙坡区打响交通基础设施建设大会战丰都县狠抓中央环保督察整改初见成效南岸区打造“多点看重庆”滨江旅游经济带初见成效袁隆平海水稻今日测产将在2.8亿亩盐碱地推广美媒解读美军在亚太重兵部署：能威慑任何对手校车不再新增跨区行驶线路美媒称航母未来惧怕五大问题这款武器排第一评论:景区“洗脑房”：购物陷阱实现“升级换代” 曲美家居因未建职业健康监护档案等4项违规遭处罚多国准备向库尔德当局摊牌伊拉克发出军事威胁城乡居保基础养老金提至202元朝阳：多举措防节日“四风”反弹顺义：廉政文化覆盖全区110个社区