DAgger algorithm – 行李の底に収めたり[YuWd]

JavaScriptを有効にしてください

DAgger algorithm

📅 2022/6/26 · ☕ 1 min read

状態: $s \in S$
行動: $a \in A$
方策: $\pi$
- $\pi : S \rightarrow A$ と定義
累積的にデータセットを増やしながら方策を学習していく感じ
誤差が少ないらしい

共有

著者

YuWd (Yuiga Wada)

機械学習・競プロ・iOS・Web

関連記事