JavaScriptを有効にしてください

【論文メモ】Fourier Features Let Networks Learn High Frequency Functions in Low Dimensional Domains

 ·  ☕ 2 min read

$$\gamma(t) = (\sin(2^0t\pi), \cos(2^0t\pi), \cdots, \sin(2^Lt\pi), \cos(2^Lt\pi))$$

  • NeRFのPositional Encoding をバンドパスフィルタと考える

  • 低周波数成分→高周波数成分への写像関数の学習

    • Positional Encodingを入れるかどうかでだいぶ精度が変わる
    • 例えば(b)の場合, (x,y) の座標値からRGBを復元するMLP


  • MLPの学習過程では, NTKカーネルの固有値が急速に減少する(らしい)
    • NTKカーネルの重要な性質として, 固有値の大きな固有ベクトルに対応する目的関数の要素は学習が速い(らしい)
    • なので, 固有値が減少→学習速度が低下→高周波数成分は学習されにくい
    • という具合らしい (…???????)
  • で, Positional Encodingはこれを防ぐことができると著者は論を進める … todo


  • この形なら大抵なんでも良いらしい


    • 本論文では, Bを 正規分布から無作為に選んでいる $B $~ $\mathcal{N}[0,\sigma^2\rbrack$
    • 重要なのは, どの程度のバンド幅なのかが重要
    • バンド幅が広いほど, 高周波数成分を学習しやすくなる (その代わり学習速度が落ちる)
  • バンド幅について

    • バンド幅が狭すぎると低周波成分のみしか得られず
    • 広すぎると高周波数成分としてノイズが付与されてしまう


共有

YuWd (Yuiga Wada)
著者
YuWd (Yuiga Wada)
機械学習・競プロ・iOS・Web