チャレンジ 2:報酬

Tutorial

intermediate

+10XP

30 mins

Unity Technologies

チャレンジ 2:報酬

本チュートリアルでは、エージェントが良い行動をしたときに、どのように報酬を与えるかについて考えるというチャレンジに取り組みます。

Resources

1. チャレンジ 2:報酬

良い行動を促すために、エージェントにどのような報酬を与えますか?私たちは最終的に、ハチドリが花にくちばしを突っ込んで、しばらくそのままにしていてほしいと思っています。花に近づいた場合に報酬を与えますか?後ろから花にぶつかるのはどうでしょうか?ハチドリがお尻で花に触れたらどうしますか?

ML-Agents は、どの行動が最も高い報酬を生むかを見つけるまで、ランダムな行動をとります。もしタスクが難しければ、最高の行動を見つけられないこともあるでしょう。また、報酬の設計が悪かったり、バランスが悪かったりすると、最も多くのポイントを得るために不正な方法を見つけてしまうかもしれません。

2. チャレンジ 2:ソリューション

Complete this Tutorial