【論文メモ】On the Versatile Uses of Partial Distance Correlation in Deep Learning

📅 2022/12/16 · ☕ 3 min read

#ECCV2022 Paper Awards pic.twitter.com/u9awGVCgSr
— European Conference on Computer Vision (ECCV) (@eccvconf) October 27, 2022

二つのモデルの挙動を比較することは極めて重要
- しかし, それぞれが異なるアーキテクチャにおけるモデルの比較方法は依然として研究が不十分.
そこで, この論文では(Partial) Distance Correlationを機械学習に応用する手法を提案.
(Partial) Distance Correlationを用いることで様々な応用が期待される.
論文中では以下の3つが提案されている.
1. モデルの条件付け
2. 敵対的サンプルへの防御
3. Disentangledな表現の学習
(Partial) Distance Correlationについては
- Distance CorrelationとPartial Distance Correlation についてを参照

あるモデルXにおいて有効な敵対的サンプル $\tilde{x}$ が存在する場合, 同じ構造のモデルYにおいても $\tilde{x}$ が有効であることが多い.
- 詳しくはWhy do adversarial attacks transfer? explaining transferabil- ity of evasion and poisoning attacks.
したがって, 二つのモデル $f_{1}, f_{2}$ に対して, ある中間層をそれぞれ $g_{1}, g_{2}$ とすると, $g_{1}, g_{2}$ の相関を下げれば, 敵対的サンプルへの防御につながると考えられる.
そこで, 以下のような損失を定義

${Loss}_{total} = {Loss}_{CE} (f_{2} (x), y) + α \cdot {Loss}_{DC} (g_{1} (x), g_{2} (x))$

${Loss}_{CE} (f_{1} (x), y) - α \cdot {Loss}_{PDC} ((g_{1} (x) | g_{2} (x)), g t)$

以下の図はGradCamを用いてモデル $X | Y$ の注目領域を可視化した結果
- ViT \ ResNet を見ると, より被写体に注目していることから, ViTはResNetでは捉えられない細かい領域を捉えている可能性が示唆される.

GeneratorにStyleGAN2を使い, (Gabbay+, NeurIPS21)の要領で学習
- データセットはFFHQ
(Gabbay+, NeurIPS21)での本来の損失 $L_{res}$ は $L_{res} = \sum_{i = 1}^{n} | | r_{i} | |^{2}$ だが,
本論文では属性 $f^{1}, f^{2}, \dots, f^{k}$ に対して, $L_{res} = d C o r ([f^{1}; f^{2}; \dots; f^{k}], r)$ を使用

著者

YuWd (Yuiga Wada)

機械学習・競プロ・iOS・Web

関連記事