JavaScriptを有効にしてください

DAgger algorithm

 ·  ☕ 1 min read


  • 状態: sS

  • 行動: aA

  • 方策: π

    • π:SA と定義
  • 累積的にデータセットを増やしながら方策を学習していく感じ

  • 誤差が少ないらしい

共有

YuWd (Yuiga Wada)
著者
YuWd (Yuiga Wada)
機械学習・競プロ・iOS・Web