試行錯誤して学んでいく卓球ロボ
これまでにも卓球ロボは存在してきましたが、今回開発されたのは、「試行錯誤を繰り返して学習していく卓球ロボ」です。
最初にチームは、本物のロボットではなく、コンピュータ内に仮想のロボットアームと卓球台を作成。
![最初はシミュレーションで学習](https://nazology.net/wp-content/uploads/2021/12/FireShot-Capture-264-Optimal-Stroke-Learning-with-Policy-Gradient-Approach-for-Robotic-Tab_-www.youtube.com_-900x531.jpg)
コンピュータシミュレーションで、ラケットの速度と向きがボールの軌道にどのような影響を与えるか機械学習させました。
そして失敗と改善を積み重ねた結果、シミュレーションでは確実にピンポン玉を返せるようになりました。
その後チームはこのアルゴリズムを、卓球ラケットをもった本物のロボットアームに導入。
現実世界で人間とラリーできるよう、さらに学習させたのです。
![本物のロボットアームで学習。最初はミスも多い。](https://nazology.net/wp-content/uploads/2021/12/5xnpaa-1.gif)
卓球ロボは、2台のカメラを使ってピンポン玉の位置を7ミリ秒ごとに追跡し、その情報に基づいて、ロボットアームをどこに動かすか決定しています。
現段階では、卓球ロボが意図したポイントから平均24.9cm以内の場所に打ち込むことが可能。
コンピュータシミュレーションより精度は落ちますが、それでも「わずかに劣る」程度のようです。
![人間とラリーできるまで成長](https://nazology.net/wp-content/uploads/2021/12/5xnpdp-1.gif)
最終的に卓球ロボは、学習に合計90分(シミュレーションと現実)を費やしただけでした。
非常に短時間ですが、人間と対戦できるほどに成長したのです。