
チャレンジ 2:報酬
Tutorial
intermediate
+10XP
30 mins
Unity Technologies

本チュートリアルでは、エージェントが良い行動をしたときに、どのように報酬を与えるかについて考えるというチャレンジに取り組みます。
Resources
1. チャレンジ 2:報酬
良い行動を促すために、エージェントにどのような報酬を与えますか?私たちは最終的に、ハチドリが花にくちばしを突っ込んで、しばらくそのままにしていてほしいと思っています。花に近づいた場合に報酬を与えますか?後ろから花にぶつかるのはどうでしょうか?ハチドリがお尻で花に触れたらどうしますか?
ML-Agents は、どの行動が最も高い報酬を生むかを見つけるまで、ランダムな行動をとります。もしタスクが難しければ、最高の行動を見つけられないこともあるでしょう。また、報酬の設計が悪かったり、バランスが悪かったりすると、最も多くのポイントを得るために不正な方法を見つけてしまうかもしれません。