This page looks best with JavaScript enabled

DAgger algorithm

 ·  ☕ 1 min read


  • 状態: $s \in S$

  • 行動: $a \in A$

  • 方策: $\pi$

    • $\pi : S \rightarrow A$ と定義
  • 累積的にデータセットを増やしながら方策を学習していく感じ

  • 誤差が少ないらしい

Share on

YuWd (Yuiga Wada)
WRITTEN BY
YuWd (Yuiga Wada)
機械学習・競プロ・iOS・Web