DAgger algorithm – 行李の底に収めたり[YuWd]

This page looks best with JavaScript enabled

DAgger algorithm

📅 Jun 26, 2022 · ☕ 1 min read

状態: $s \in S$
行動: $a \in A$
方策: $\pi$
- $\pi : S \rightarrow A$ と定義
累積的にデータセットを増やしながら方策を学習していく感じ
誤差が少ないらしい

Share on

WRITTEN BY

YuWd (Yuiga Wada)

機械学習・競プロ・iOS・Web

関連記事