JavaScriptを有効にしてください

DAgger algorithm

 ·  ☕ 1 min read


  • 状態: $s \in S$

  • 行動: $a \in A$

  • 方策: $\pi$

    • $\pi : S \rightarrow A$ と定義
  • 累積的にデータセットを増やしながら方策を学習していく感じ

  • 誤差が少ないらしい

共有

YuWd (Yuiga Wada)
著者
YuWd (Yuiga Wada)
機械学習・競プロ・iOS・Web