論文 – 行李の底に収めたり[YuWd]

ar5ivのコードを読む

📅 2022/7/7 · ☕ 1 min read

https://github.com/dginev/ar5iv 前提: arxivは投稿時, texをアップロードしなければならない ar5iv: 裏でクローラを回して, latexmlをキャッシュしてるだけっぽい最終的にHTMLに変換されたものをzipで固めてサーバ上で管理レンダリング時はzipを展開して独自のCSSで書き換えたものを表示 Rust製 ...

【論文メモ】Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigation

📅 2022/7/7 · ☕ 1 min read

VLN-DUET 概要 localな情報とグラフを用いたglobalな情報の両方を統合してactionを決定する actionが決定されたら, Graphを動的に構築して, 移動先までの最短経路をワーシャルフロイドで探索各ノードには, viewから得られた特徴量を埋め込み表現として保持する行動 $a^\pi$は各ノードへの尤度によって表現され, ノ ...

【論文メモ】Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigation

【論文メモ】Graph Transformer: A Generalization of Transformer Networks to Graphs

📅 2022/7/7 · ☕ 1 min read

任意のGraphに適応可能な, 汎用Transformer Positional Encodingがラプラシアン行列の固有値で表現されるラプラシアン行列の固有値 $\lambda$は頻度・周波数的な側面を持つ → グラフ上のフーリエ変換・畳み込みでは $\lambda$が使われる (いつかまとめる→todo) todo https://arxiv.org/pdf/2012.09699v2.pdf ...

#論文

【論文メモ】Graph Transformer: A Generalization of Transformer Networks to Graphs

【論文メモ】ViLD: Open-vocabulary Object Detection via Vision and Language Knowledge Distillation

📅 2022/7/7 · ☕ 1 min read

Open-Vocabulary (任意テキスト入力)な物体検出モデル classifierがCLIP特徴量になっている ...

#論文

【論文メモ】ViLD: Open-vocabulary Object Detection via Vision and Language Knowledge Distillation

【論文メモ】SwinIR: Image Restoration Using Swin Transformer

📅 2022/7/7 · ☕ 1 min read

残差接続が大量にあるの面白い多分だけど, 真っ黒から真っ黒への変換みたいな無意味な変換によって重みの学習を引っ張られたくないので, クソデカ残差を入れているのだと思う (オキモチ) SwinTransformerのおかげでパラメタ数はかなり減っている ...

#論文

【論文メモ】SwinIR: Image Restoration Using Swin Transformer

【論文メモ】LXMERT

📅 2022/7/7 · ☕ 1 min read

ViLBERTとの大きな違いは, ROIのみを入力とする点 ...

#論文

Impact Factor

📅 2022/7/6 · ☕ 1 min read

学術雑誌の影響力を測る指標らしい (そんなのあるんだ) 今年の被引用数を過去2年分のPublicationで割る $\displaystyle {\text{IF}}_{y}={\frac {{\text{Citations}}_{y}}{{\text{Publications}}_{y-1}+{\text{Publications}}_{y-2}}}.$ ...

【論文メモ】Do Transformer Modifications Transfer Across Implementations and Applications?

📅 2022/6/27 · ☕ 1 min read

Transformerの改善案は大量にあるが, 本当に有効なのはどれだけあるの？という論文結論 (有効な改善方法) 活性化関数: GLU+GeLU/Swish 正規化: RMS Norm パラメタ共有: デコーダの入出力における埋め込み表現を共有すると良いアーキテクチャ Mixture of Experts Transformer Synthesizer Product Key Memory ...