YY维新网-从0开始学，阿尔法元完胜阿尔法狗

首页 » 投资

从0开始学，阿尔法元完胜阿尔法狗

来源：消费保　时间:2019年02月19日作者：张某某　

中青在线讯（中国青年报·中青在线记者张茜） 10月18日，《自然》杂志网站公布的论文显示，此前战胜人类围棋世界冠军的电脑程序AlphaGo的开发团队又出力作——新程序AlphaGo Zero（阿尔法元）不依靠人类指导和经验，仅凭自身算法强化学习，就以100:0的战绩击败了AlphaGo（阿尔法狗）。

此消息给世人带来了不小的震动。此前被AlphaGo 击败的世界知名围棋选手柯洁今早在社交平台上表示：“一个纯净、纯粹自我学习的AlphaGo是最强的……对于AlphaGo的自我进步来讲……人类太多余了。”

那么，经过升级的AlphaGo Zero 到底是如做到“长江后浪推前浪”的呢？

人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。

《自然》杂志的公开消息称，为了打败人类围棋世界冠军，科学家在训练上一款AlphaGo时，同时用到了监督式学习（基于上百万种人类专业选手的下棋步骤）和基于自我对弈的强化学习。此前那款AlphaGo的训练过程长达几个月，用到多台机器和48个TPU（神经网络训练所需的专业芯片）。

而在最新发表的论文中，作者David Silver, Julian Schrittwieser, Karen Simonyan, Demis Hassabis等在介绍AlphaGo Zero时表示，它的学习从零开始，且单纯基于与自己的对弈。人类的输入没有超出游戏规则以外的任何指导、数据以及内部知识。

AlphaGo Zero仅用到一张神经网络，这张网络经过训练，专门预测程序自身的棋步和棋局的赢家，在每次自我对弈中进步。新程序只使用一台机器和4个TPU。

通过几天的训练——包括近500万局自我对弈——AlphaGo Zero便能够超越人类并打败所有之前的AlphaGo版本。

David Silver团队在其公司DeepMind网站中总结道，AlphaGo Zero相比与AlphaGo 的更强大之处恰恰在于：“它再也不会受到人类经验的限制，而是可以不断向世界上最强的围棋手——也就是它自己学习到非既定的能力。”

《自然》杂志也在社交平台上表示，随着程序训练的进行，AlphaGo Zero独立发现了人类用几千年才总结出来的围棋规律，还建立了新的战略，为这个古老的游戏带来新见解。

责任编辑：张义凌

华富劳务公司

【免责声明】：YY维新网发布此信息目的在于传播更多信息，与本网站立场无关。YY维新网不保证该信息的准确性、真实性、完整性、有效性等。相关信息未经过本网站证实，不构成任何投资建议，据此操作，风险自担。

全网热点

外媒称中国打造小型潜艇:能运送“蛙人”实现突袭外媒称中韩中日关系渐回暖：日韩派团来华抢商机中俄宽体客机或2025年运营效率比空客波音高15% 厦门飞长沙航班发生劫持事件？经查系扰序案件台“立委”建议征“出境税”遭批：无所不用其极崔世安：澳门将于2018年启动编制防灾减灾十年规划出海记｜港媒：中石油中俄原油管道二线工程全线贯通出海记｜港媒：中银拟年底推出跨境电子支付服务尼泊尔撕毁与中企水电站协议或因印度施压印媒称富士康推迟在印设厂或与中印关系紧张有关日媒称亚洲海上贸易集中在中日：东南亚不甘心被“路过” 湖南省公安厅辟谣川航劫机事件：系扰序案件，并非劫机老人在小区顶楼架网捕鸟“挂”在17楼外两小时南京完成第54例造血干细胞捐献 “熊猫”惊艳哈瓦那

舆情热点

给警方“最后通牒”的“港独”组织申诉期被延长人民日报评个税改革：要让群众收入更有分量网约车新政实施两年:执法趋严打车难依旧突出那些“进不来”中国的美国大豆欧洲真能吞下吗？台当局称慰安妇“自愿” 台媒:自己人欺负自己人多地调整最低工资标准和工资指导线你工资涨了吗中央用这18个字为今年下半年经济工作定调将中俄视为对手美国防部拟8月起组建3支太空军刘烈宏任中央网信办副主任(图/简历) 俄版战斧要和轻护打包卖中国专家称是俄一厢情愿中越经济关系进入历史最佳阶段南海争议不是主流这两个副部级老同事都自首媒体：某些人不妨学学中国籍男子在日被逮捕涉嫌无许可持有大量医药品坦克大赛第二日现关键改判哈萨克斯坦反超中国队福建省军区司令员于中海调任江苏省军区司令员