-
Neural Tangent Kernel
-
以下に示すようなカーネル
$$k_{\mathrm{NTK}}(x_i, x_j) = E_{\theta \sim \N} \left\langle \frac{\partial f(x_i; \theta)}{\partial \theta}, \frac{\partial f(x_j; \theta)}{\partial \theta} \right\rangle$$ -
特に, 入力をhypersphereに限定すると, MLPのNTKは $h_{\mathrm{NTK}}(\mathbf x_i^\top \mathbf x_j)$と内積の形で書ける
-
-
幅が無限にデカイ全結合層を考えると, 重みはほとんど初期値の近くしか動かず, このモデルはNTKによるカーネル回帰と同じ挙動をする(らしい)
-
再生核ヒルベルト空間において, カーネル関数 $K(x,y)$は $x, y$の類似度・近さを表す
JavaScriptを有効にしてください
NTK
· ☕ 1 min read