从0开始学,阿尔法元完胜阿尔法狗
来源:消费保  时间:2019年02月19日 作者:张某某 

    中青在线讯(中国青年报·中青在线记者 张茜) 10月18日,《自然》杂志网站公布的论文显示,此前战胜人类围棋世界冠军的电脑程序AlphaGo的开发团队又出力作——新程序AlphaGo Zero(阿尔法元)不依靠人类指导和经验,仅凭自身算法强化学习,就以100:0的战绩击败了AlphaGo(阿尔法狗)。

    此消息给世人带来了不小的震动。此前被AlphaGo 击败的世界知名围棋选手柯洁今早在社交平台上表示:“一个纯净、纯粹自我学习的AlphaGo是最强的……对于AlphaGo的自我进步来讲……人类太多余了。”

    那么,经过升级的AlphaGo Zero 到底是如做到“长江后浪推前浪”的呢?

    人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。

    《自然》杂志的公开消息称,为了打败人类围棋世界冠军,科学家在训练上一款AlphaGo时,同时用到了监督式学习(基于上百万种人类专业选手的下棋步骤)和基于自我对弈的强化学习。此前那款AlphaGo的训练过程长达几个月,用到多台机器和48个TPU(神经网络训练所需的专业芯片)。

    而在最新发表的论文中,作者David Silver, Julian Schrittwieser, Karen Simonyan, Demis Hassabis等在介绍AlphaGo Zero时表示,它的学习从零开始,且单纯基于与自己的对弈。人类的输入没有超出游戏规则以外的任何指导、数据以及内部知识。

    AlphaGo Zero仅用到一张神经网络,这张网络经过训练,专门预测程序自身的棋步和棋局的赢家,在每次自我对弈中进步。新程序只使用一台机器和4个TPU。

    通过几天的训练——包括近500万局自我对弈——AlphaGo Zero便能够超越人类并打败所有之前的AlphaGo版本。

    David Silver团队在其公司DeepMind网站中总结道,AlphaGo Zero相比与AlphaGo 的更强大之处恰恰在于:“它再也不会受到人类经验的限制,而是可以不断向世界上最强的围棋手——也就是它自己学习到非既定的能力。”

    《自然》杂志也在社交平台上表示,随着程序训练的进行,AlphaGo Zero独立发现了人类用几千年才总结出来的围棋规律,还建立了新的战略,为这个古老的游戏带来新见解。

 

责任编辑:张义凌

华富劳务公司



















【免责声明】:YY维新网发布此信息目的在于传播更多信息,与本网站立场无关。YY维新网不保证该信息的准确性、真实性、完整性、有效性等。相关信息未经过本网站证实,不构成任何投资建议,据此操作,风险自担。
推荐文章
  YY维新网免费提供的行情数据以及其他资料均搜集整理自互联网,仅作为用户获取信息之目的,并不构成投资建议。YY维新网不为本页面提供的信息错误、残缺、 延时或因依靠此信息所采取的任何行动负责。市场有风险,投资需谨慎       最后修改时间:2019-12-21 04:32:09
Copyright © 2018 www.yyweixin.cn All Rights Reserved 浙ICP备888888号-4  深圳石岩镇官田村横坑工业区劳务派遣公司深圳布吉劳务派遣公司 ***、* 快推进品牌 海葵逼近申 市领导会见 2007上 阵雨乌云毁 近期上海临 国家最高科 让市民吃上 市电力部门