-
NACCL22
- 多言語を扱うモデルにおいて, 言語の数を増やせば増やすほど精度が下がる「the curse of multilinguality」(多言語の呪い)という現象が存在する
- この「多言語の呪い」を対処するモデルとしてX-MODを提案
-
概略
- 言語ごとにbottleneck型のモジュールを用意し, 言語ごとにスイッチさせる
- それ故, 拡張は容易で, 学習・推論時のコストはかからない
- また, 新たな言語を追加するのも容易い
This page looks best with JavaScript enabled
【論文メモ】Lifting the Curse of Multilinguality by Pre-training Modular Transformers
· ☕ 1 min read