Reformer – 行李の底に収めたり[YuWd]

JavaScriptを有効にしてください

Reformer

📅 2022/2/17 · ☕ 1 min read

#post

Attentionの計算量をO(NlogN)に
- 従来のTransformerだと内積計算がネック
- 類似度を計算しさえすれば良い
  - ベクトルを回転させてバケツにブチこむ
  - バケツごとに処理
  - バケツ内は互いに近いベクトルのはず
https://gyazo.com/9a2bf1939cfd7fd3bea5864b9664eed2
Reversible Residual layers
- Transformerを多層化するとそれだけの途中の状態を保存する必用がありますが、Reformerでしたら多層化してもそれぞれの層で状態を再計算できるため、メモリに保持する必用がなく、層の数だけメモリを削減できます。
- https://recruit.gmo.jp/engineer/jisedai/blog/reformer/

共有

著者

YuWd (Yuiga Wada)

機械学習・競プロ・iOS・Web

関連記事