【論文メモ】Fourier Features Let Networks Learn High Frequency Functions in Low Dimensional Domains – 行李の底に収めたり[YuWd]

【論文メモ】Fourier Features Let Networks Learn High Frequency Functions in Low Dimensional Domains

📅 2022/7/12 · ☕ 2 min read

#論文

NeRFで用いられるPositional Encodingについて, NTKによる分析を行った論文

$γ (t) = (\sin (2^{0} t π), \cos (2^{0} t π), \dots, \sin (2^{L} t π), \cos (2^{L} t π))$

NeRFのPositional Encoding をバンドパスフィルタと考える
低周波数成分→高周波数成分への写像関数の学習
- Positional Encodingを入れるかどうかでだいぶ精度が変わる
- 例えば(b)の場合, (x,y) の座標値からRGBを復元するMLP
  - →AutoEncoderと考えれば良い

MLPの学習過程では, NTKカーネルの固有値が急速に減少する(らしい)
- NTKカーネルの重要な性質として, 固有値の大きな固有ベクトルに対応する目的関数の要素は学習が速い(らしい)
- なので, 固有値が減少→学習速度が低下→高周波数成分は学習されにくい
- という具合らしい (…???????)
で, Positional Encodingはこれを防ぐことができると著者は論を進める … todo

この形なら大抵なんでも良いらしい
- 本論文では, Bを正規分布から無作為に選んでいる $B$ ~ $N [0, σ^{2}]$
- 重要なのは, どの程度のバンド幅なのかが重要
- バンド幅が広いほど, 高周波数成分を学習しやすくなる (その代わり学習速度が落ちる)
バンド幅について
- バンド幅が狭すぎると低周波成分のみしか得られず
- 広すぎると高周波数成分としてノイズが付与されてしまう

共有

著者

YuWd (Yuiga Wada)

機械学習・競プロ・iOS・Web

関連記事