AlphaZero完胜三大世界冠军棋类程序:5000个TPU、自学一天

  • 时间:
  • 浏览:43

  训练次数 | 训练时间 | 对弈冠军棋类程序

  30万,2小时,击败将棋Elmo

  11万,4小时,击败国际象棋Stockfish

  16.5万,8小时,击败围棋AlphaGo

  把Go去掉,意味着AlphaZero ,已经是比AlphaGo Zero更通用的程序。

  一直以来,尽管众多顶尖的AI的程序都超过了人类世界冠军的水平,但它们都只能在单一的领域执行单一的任务,并不能把这种击败人类的超能力泛化到其他任务中。

  而DeepMind的野心可不仅仅是在棋类游戏上超越人类,这次他们研究出了这个更通用的程序AlphaZero,将会马上投入到蛋白折叠的应用上。

  官方称,他们不久就会发表相关论文,通过检测出蛋白错误折叠来快速诊断神经退行性疾病,比如阿尔茨海默症,帕金森,囊状纤维化。

  期待AlphaZero在医疗健康领域的表现。

  更多棋技的讨论,可以参看知乎上的PENG Bo的评价:https://zhuanlan.zhihu.com/p/31749249

  原论文链接:https://arxiv.org/pdf/1712.01815.pdf

  — 完—