ルールを教えなくてもチェスや将棋を理解できるAIが開発される
ルールを教えなくてもチェスや将棋を理解できるAIが開発される / Credit:Depositphotos
artificial-intelligence

ゲームのルールを一切教えなくても「自ら学んで戦えるAI」が開発される! (3/3)

2021.01.27 Wednesday

2020.12.25 Friday

techxplore https://techxplore.com/news/2020-12-deepmind-muzero-conquers.html , DeepMind https://deepmind.com/blog/article/muzero-mastering-go-chess-shogi-and-atari-without-rules

MuZeroはルールを教えられなくても、従来のAIを超える能力を獲得した

MuZeroは①値②方針③報酬の環境要素をモデル化する
MuZeroは①値②方針③報酬の環境要素をモデル化する / Credit:DeepMind

MuZeroはルールを把握するために、環境から次の3要素をモデル化します。

①値:現在の位置はどれくらい良いか?

②方針:どのアクションを実行するのが最適か?

③報酬:最後の行動はどれくらい良かったか?

つまりMuZeroは、成功した手法から学び、失敗した手法を避け、関連性と成功率が最も高い操作を優先していくのです。

従来のAIは「ルール」と「先読み検索」という原則で成り立っています。そのためルールに基づいて対戦相手が指し得る膨大な手を予測し、すべて評価しなければいけませんでした。

しかし、MuZeroは「経験から学ぶ手法」であり、そこから最善の手を生み出します。そのためルールが与えられていなくても戦えますし、試行回数が増えるにつれて能力も向上していきます。

チェス・将棋・囲碁:(縦軸)能力値、(横軸)試行回数、(青線)MuZero、(オレンジ線)従来AI / Atari:(青線)MuZero、(オレンジ線)人間、(実線)平均値、(破線)中央値
チェス・将棋・囲碁:(縦軸)能力値、(横軸)試行回数、(青線)MuZero、(オレンジ線)従来AI / Atari:(青線)MuZero、(オレンジ線)人間、(実線)平均値、(破線)中央値 / Credit:DeepMind

実際、MuZeroはシンプルなルールの囲碁チェス将棋において従来のAIと同等の能力を身に着け、場合によっては打ち負かすこともできたとのこと。

さらに、画像情報が多いため従来のAIではモデル化が難しいとされていたビデオゲームAtari」の57作品(パックマンのようなクラッシックゲームなど)においても、ルールを一切教わらずに、一般的な人間に勝てるようになったというのです。

さて、今回の報告によって、AIがゲームの分野で「ルールを発見し、一般的な人間や従来のAIを超える」という大きな課題をクリアしたと分かります。

このアルゴリズムを応用すれば、「ルールが知られていない」ロボット工学、産業システム、または現実世界の環境における新たな問題を解決するのに役立つかもしれません。

<

1

2

3

>

みなさんのおかげでナゾロジーの記事が「Googleニュース」で読めるようになりました!
Google ニュースを使えば、ナゾロジーの記事はもちろん国内外のニュースをまとめて見られて便利です。
ボタンからダウンロード後は、ぜひフォローよろしくおねがいします。
App Store からダウンロード Google Play で手に入れよう

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!