Posts

【論文メモ】SmeLU

📅 2022/4/7 · ☕ 1 min read

ReLUの原点での急な変化を, 2次関数で補完することでスムーズにした活性化関数 SmeLU (Smooth ReLU)を提案リコメンデーションシステムにおいては, 再現性の低さは致命的となる ReLU は勾配がジャンプするので(sudden jump), 損失平面に局所領域ができてしまうそのため, 遷移領域が狭まる遷移領域が狭まってしまうと局所的な遷移しかしないので, モデ ...

#論文

Capsule Neural Network

📅 2022/4/5 · ☕ 1 min read

背景: pooling処理によって, 特徴間の相対的な関係性が学習しににくなっているスカラではなくベクトルですべて処理する https://qiita.com/motokimura/items/cae9defed10cb5efeb62 ...

#post

ReLUは如何に関数を近似するか？

📅 2022/4/4 · ☕ 2 min read

#* 関数近似 NNは基本的に関数近似器活性化関数があることで非線形なものも近似することができる活性化関数がなければ, ただの線形変換にしかならない＋層を重ねる意味がない ReLUはほとんど線形関数と変わらないけど, どのように関数を近似するのか？大前提 : ReLUは折りたたみを表現できるなので, カクカクで任意の関数を近似できる $$f(x) = ...

tqdm

📅 2022/4/3 · ☕ 1 min read

tqdmのプログレスバーはstderr出力 teeで出力したいなら, 出力先を変える ...

#post

LambdaNetwork

📅 2022/4/3 · ☕ 1 min read

MSAと同様, d方向に分割して, 並列処理行列計算に関しては torchのテンソル積を参照 Linear Attention LambdaNetsはContentとPositionの２つを計算する Contentのみを出力とすれば, Linear Attentionと同等になる → Efficient Transformer ...

#post

torchのテンソル積

📅 2022/4/1 · ☕ 1 min read

三次元 $\times $三次元の行列１つ目をバッチサイズとして, バッチ単位で行列積 torch.bmm 4次元 $\times $3次元の行列 (j×1×n×m) と (kxm×p)の積は(j,k,n,p)となるバッチなど、行列以外の次元は、ブロードキャストされる。そのため、行列以外の次元はブロードキャストできるものでなければならない。例えば、tensor1が(j×1×n× ...

torch.bmm

📅 2022/4/1 · ☕ 1 min read

バッチサイズ単位で行列積 @も同様 https://pytorch.org/docs/stable/generated/torch.bmm.html#torch.bmm ...

PointWise・Depthwise

📅 2022/3/30 · ☕ 1 min read

https://agirobots.com/depthwise-pointwise-convolution/ ...

#post

ResNetを現代風に DepthWiseにしたり (PointWise・Depthwise) カーネルサイズ変えたり bottleneck内のレイヤーの順番を変えたり BNからLNにしたり地味に実装でtimmつかてますねん https://github.com/facebookresearch/ConvNeXt/blob/d1fa8f6fef0a165b27399986cc2bdacc92777e40/models/convnext.py ...

#論文

Resnet

📅 2022/3/30 · ☕ 1 min read

bottleneck 1x1の畳み込みでチャネル数を減らす https://cvml-expertguide.net/terms/dl/cnn-backbone/resnet/ ...

#post

Posts

ReLU

📅 2022/4/7 · ☕ 1 min read

【論文メモ】SmeLU

📅 2022/4/7 · ☕ 1 min read

Capsule Neural Network

📅 2022/4/5 · ☕ 1 min read

NN

📅 2022/4/4 · ☕ 0 min read

ReLUは如何に関数を近似するか？

📅 2022/4/4 · ☕ 2 min read

ELU

📅 2022/4/3 · ☕ 1 min read

tqdm

📅 2022/4/3 · ☕ 1 min read

LambdaNetwork

📅 2022/4/3 · ☕ 1 min read

torchのテンソル積

📅 2022/4/1 · ☕ 1 min read

torch.bmm

📅 2022/4/1 · ☕ 1 min read

PointWise・Depthwise

📅 2022/3/30 · ☕ 1 min read

【論文メモ】ConvNext

📅 2022/3/30 · ☕ 1 min read

Resnet

📅 2022/3/30 · ☕ 1 min read