AWS DeepRacer – Reinforcement Learning Models

走るたびに“報酬”を与えてAIに学ばせる方式で、上手に走れればごほうびを、曲がれなければペナルティ。こうしてAIが最適なハンドル操作を身につけていくのが深層強化学習の楽しいところだよ。

コメント

タイトルとURLをコピーしました