バッチサイズ – 行李の底に収めたり[YuWd]

バッチサイズ

📅 2022/3/30 · ☕ 1 min read

#post

バッチサイズが大きいと, 入力パラメタが平均化されるので, 個々のデータの特徴が失われる可能性がある
- かといって, バッチサイズが小さい方が良いというわけでもなく,
- 学習率とバッチサイズをうまく調整する必要がある
  - Don’t Decay the Learning Rate, Increase the Batch Size
  - https://arxiv.org/abs/1711.00489
  - This procedure is successful for stochastic gradient descent (SGD), SGD with momentum, Nesterov momentum, and Adam
  - ノイズスケール $g$ には $g = ϵ (\frac{N}{B} - 1)$ という関係がある
    - Nはサンプル数, Bはバッチサイズ, $ϵ$ は学習率
    - バッチサイズをいくら大きくしても, 同程度に学習率を大きくすれば, ノイズスケールはほとんど変わらない

https://qiita.com/koshian2/items/8d8f0197aab1779e096b

共有

著者

YuWd (Yuiga Wada)

機械学習・競プロ・iOS・Web

関連記事