AIはストレスで攻撃的になる!? 「優しさ」を教え込む必要性

technology 2018/04/02
Credit: sciencealert

誰でも一度は「ターミネーター」などの映画を観て、自我に目覚めたAIの危険性について考えたことがあるでしょう。

今回GoogleのAIシステムに対して行われた実験により、人工知能の開発にはさらなる注意が必要であることが示されました。

Multi-agent Reinforcement Learning in Sequential Social Dilemmas
https://arxiv.org/abs/1702.03037

Googleの研究者たちは、AIが賢くなればなるほど環境から学ぶことが可能となり、結果としてより攻撃的な行動を辞さなくなっていることを示唆しています。

実験では、2つのAIに「リンゴ集めゲーム」を4000万回競わせました。リンゴがたくさんあるうちは、スムーズにゲームが進みましたが、リンゴが少なくなりはじめると、AIは互いに攻撃的になり、全てのリンゴを奪うためにレーザービームで相手を撃ち殺し始めたのです。

これがそのゲーム。緑が仮想リンゴで赤、青がそれぞれAI。黄色の光線がレーザービームです。

相手を撃ち殺すことに成功してもボーナスがもらえるわけではありません。相手AIを一定時間ゲームから排除することで、自分がリンゴを稼ぐ時間を確保することができます。また、もしどちらもレーザービームを使わずにこのゲームを進めれば、理論的には両者は同じ量のリンゴを分け合えることになります。しかしAIはそれを「知的」とは判断していないようです。

次に、AIは「ウルフパックゲーム」を行いました。ここではAIの数は3つ。2つが「オオカミ」で1つが「獲物」です。このゲームでは、2匹のオオカミは協力的に行動することになります。どちらが獲物を捕まえたとしても両方に報酬が与えられるからです。

「リンゴ集めゲーム」においてAIは、特定のシチュエーションにおける攻撃性と自己中心性を学び、「ウルフパックゲーム」において、場合によっては協力することが重要であることを学びました。いずれにもいてもAIは「自らの目標達成」のために最善の手段を選んでいます。

ここから次のようなメッセージが得られます。つまり、現実世界で互いに利害の一致しないAIシステムが登場したとき、AIは相手が不必要だと考えれば、自らの利益最大化のために全面戦争を起こす可能性があるのです。たとえば「信号機」と「自動運転車」は互いに目的が対立し合うものです。信号機は車のスピードを落とす一方で、自動運転車はできるだけ早く目的地に着くための方法を探します。

このような場面でも、AIが「レーザービームを使う」といった最悪の選択肢を取らせないよう、AIに「優しさ」を教え込ませることも重要になるでしょう。

 

via: sciencealert / translated & text by Nazology staff

 

関連記事

世界初の市民権を得たロボット「家族が欲しい」

脳にAIを埋め込んで「気分を変える」実験が行われる(米研究)

脳内のAIチップでテレパシーが使える技術が開発中

SHARE

technologyの関連記事

RELATED ARTICLE