post – 行李の底に収めたり[YuWd]

Transformer

📅 2022/3/29 · ☕ 3 min read

encoder: self-attention → feed-forward NN decoder: self-atteiont → multi-head attention → feed-forward NN self-attention K,V,Qをsource内部で学習 attention K,V,Qをsource-target間で学習 multi-head 各単語ごとにK,V,Qを計算するのではなく, ヘッドの数だけ小さいK,V,Qを計算してconcat. 出力時に重みWをかけて次元を調整学習対象は各ヘッドの重みW_Q, W_K, W_V と出力W_O attention機構自体には ...

#post

BERT

📅 2022/3/29 · ☕ 1 min read

BERTの新規性はMasked LM(事前学習タスク) 事前に行うタスク=「事前学習タスク(pre-training task)」解きたかったタスク=「下流タスク(downstream task)」渡されたパラメータを下流タスクの学習の際に固定するかしないか固定するなら「特徴量ベースのアプローチ」固定されたパラメータを持つモデ ...

#post

PyTorchとメモリ

📅 2022/3/29 · ☕ 1 min read

必要なメモリ量必要メモリ量(byte) = (ニューロンの数 × Batch Size ＋パラメータ数) × 2 (data & grad) × 4(byte) https://nori-life-log.com/nnの学習で必要なgpuメモリを算出する重みを固定(freeze) 1 2 3 # freeze all layers for param in model.parameters(): param.requires_grad = False ...

Over-smoothing

📅 2022/3/29 · ☕ 1 min read

#GNN ...

#post

百兆の詩篇

📅 2022/3/28 · ☕ 1 min read

レーモン・クノー ...

#post

Faster-RCNN

📅 2022/3/25 · ☕ 1 min read

ROI pooling ...

#post

np.float32

📅 2022/3/24 · ☕ 1 min read

pythonのfloatはCでいうdouble np.float32はCのfloatと同じ一方, np.float64はpythonのfloat float in Py == double in C == np.float64 == 8バイト np.float32 === float in C == 4バイト ...

#numpy
#post

標準化

📅 2022/3/22 · ☕ 1 min read

訓練セットの分散、平均、最大値、最小値などの情報を使ってテストセットを変換する ...

#post

DatasetGAN

📅 2022/3/19 · ☕ 1 min read

GANによって生成した画像に対して、自動的にアノテーションを付与するネットワークを学習する点が新しい。StyleGANの特徴量は、アノテーションを生成するために十分な情報を持っているという仮説に基づき、シンプルなネットワークでそれを実現できることを示している。 ...

#post

後で読む

📅 2022/3/19 · ☕ 1 min read

todo ...

#post

SBERT-WK

📅 2022/3/19 · ☕ 1 min read

BERT, Sentence BERT は各層における単語の分散に着目していない「各単語の各層での埋め込み表現がどの程度の分散を持つか」を調べる以後, 分散＝**各層でのばらつき **なので注意 ↓ can, wouldのような意味の少ない単語だと分散が小さいが, 意味が多い単語だと分散が大きいこの問題に対応するために, 各層に対して重み付け和を取ったものを新たな埋め込み ...

#post

lvalue・rvalue

📅 2022/3/19 · ☕ 0 min read

...

#C++
#post

einsum

📅 2022/3/18 · ☕ 1 min read

アインシュタインの縮約記法テンソル積を書くと大量の

Σ

が出てきてうざいなので,

Σ

を省略しよう, というのが事の始まり

\sum_{j} a_{i, j} b_{j, k}

なら ij,jk → ik プログラム的に考えれば, 単純にfor を外しただけ例えばドット積 z[i,j](https://scrapbox.io/yuwd/i%2Cj) += x[i,j](https://scrapbox.io/yuwd/i%2Cj) * y[i,j](https://scrapbox.io/yuwd/i%2Cj) np.einsum("ij,ij->ij", x, y) 内積 z[j,k](https://scrapbox.io/yuwd/j%2Ck) += x[j,i](https://scrapbox.io/yuwd/j%2Ci) * y[i,k](https://scrapbox.io/yuwd/i%2Ck) np.einsum("ji,ik->jk", x, y) 軸の入れ替えなどでも使える y = torch.einsum('nchw->nhwc', y).detach().cpu() 実際は遅いからやめたほうが良さそう ...