機械学習 – 行李の底に収めたり[YuWd]

【LangChain】Agentの仕組みを理解して, 任意のLLMを使用する

📅 2023/2/6 · ☕ 3 min read

OpenAIの提供するGPT-3には何種類かある text-davinci-003 / text-curie-001 / text-babbage-001 / text-ada-001 特にLangChainでは最も性能の良いtext-davinci-003が使用されている．だが，APIは金が掛かるのでなるだけフリーのLLMが使いたい → transformers-openai-api等で偽サーバを建てて，APIのオリジンをすり替えると任意のL ...

Distance CorrelationとPartial Distance Correlation について

📅 2022/12/11 · ☕ 4 min read

概要 pearsonの相関係数は線形な関係しか捉えることが出来ない. そこで, 点同士の距離を用いたDistance Correlationという相関係数が提案された. さらに, Distance Correlationを拡張し, 内積の期待値が共分散の二乗となるようなヒルベルト空間を定義したPartial Distance Correlationが提案されている. ...

Distance CorrelationとPartial Distance Correlation について

【論文メモ】Deep Learning without Shortcuts: Shaping the Kernel with Tailored Rectifiers

📅 2022/11/2 · ☕ 8 min read

はじめに ICLR22 [paper] 深層学習において, 残差接続は不可欠な存在となりつつある残差接続により, より深い層数のNNを実現できるようになった残差接続に対する解釈の矛盾昨今の研究により残差接続は比較的浅い層をアンサンブルするような効果があるとの見方が強まっているしかし, 「深層」学習という名が体を表す通り, 一般には「層を増やす」ことがモデ ...

【論文メモ】Deep Learning without Shortcuts: Shaping the Kernel with Tailored Rectifiers

日本語版Image Captioningの学習・推論コードを提供する

📅 2022/10/5 · ☕ 1 min read

ひょんなことから最近Image Captioning(画像キャプション生成)を触っているだが, ググってもググっても日本語でImage Captioningしてる人があまりに居ない… コードを検索してもヒットしたのはこの子だけ…🤔 (しかもChainer …) https://github.com/yuyay/chainer_nic 日本語での画像キャプション生成界隈はプレイヤ ...

【論文メモ】Can Neural Nets Learn the Same Model Twice? Investigating Reproducibility and Double Descent from the Decision Boundary Perspective

📅 2022/9/24 · ☕ 4 min read

はじめに CVPR22 決定境界を描画し, 再現性と汎化性について定量的に考察した論文決定境界の描画 (領域の決定) 如何に決定境界を描画するかが重要になってくるその上でまず, データ多様体

M

の近傍(on-manifold)を取るのか,

M

から離れた領域(off-manifold)を取るのかを考 ...

【論文メモ】Can Neural Nets Learn the Same Model Twice? Investigating Reproducibility and Double Descent from the Decision Boundary Perspective

Stochastic Gradient Langevin Dynamicsを理解する

📅 2022/9/5 · ☕ 4 min read

はじめに MCMCの一種目標: ある分布

π (x)

からのサンプリングを行いたい Metropolis-Hastingsアルゴリズム (MH) Hamiltonian Monte Carlo (HMC) Langevin Dynamics (Metropolis-adjusted Langevin Algorithm) Stochastic Gradient Langevin Dynamics (SGLD) の順に見ていくと理解しやすい Metropolis-Hastings Metropolis-Hastingsについては既知のもとする提案分布

q (z)

を元に判定関数を用いて受容・棄却を行うMCMC cf. ...

Energy Based Model

📅 2022/8/27 · ☕ 3 min read

Energy Based Model 生成モデルによく用いられる拡散モデルとも関係が深い分類回帰問題についてはYour classifier is secretly an energy based model and you should treat it like oneを参照 GANやVAE同様, データ

x

は何らかの高次元確率分布

p (x)

からサンプリングされたものと仮定する EBMでは以下のように確率分布

p (x)

を仮定し, $E_{\theta}(\boldsym ...

Peter Anderson

📅 2022/8/26 · ☕ 1 min read

すげえ人 SPICE SPICE: Semantic Propositional Image Caption Evaluation REVERIE REVERIE - Remote Embodied Visual Referring Expression in Real Indoor Environments Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering Sim-to-Real Transfer for Vision-and-Language Navigation など, めちゃくちゃよく見る論文の著者今はGoogleにいるらしい ...

日本語キャプションデータセット

📅 2022/8/15 · ☕ 1 min read

STAIR MSCOCOにキャプションを付与全部で820,310件のキャプション http://captions.stair.center/ Yuya Yoshikawa, Yutaro Shigeto, and Akikazu Takeuchi, “STAIR Captions: Constructing a Large-Scale Japanese Image Caption Dataset”, Annual Meeting of the Association for Computational Linguistics (ACL), Short Paper, 2017. YJ Captions 26k Dataset こちらもMSCOCOにキャプションを付与したもので, ACL2016 キャプション数がSTAIRの1/6程度 https://github.com/yahoojapan/YJCaptions Takashi Miyazaki and Nobuyuki Shimizu. 2016. Cross-Lingual Image Caption Generation. In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 1780 ...

RPN

📅 2022/7/30 · ☕ 1 min read

Resion Proposal Network 背景なのか, 物体が写っているのかだけを識別するサブモジュール Faster-RCNNにおいては, ①RPNで領域を絞ってから, ②それぞれ個々の物体についてラベルを絞っていく Faster-RCNNの学習では, 「RPNの重み更新→モデル全体の重み更新」を繰り返して学習 RPNでは, Anchor boxが背景か物体か / 物体ならばGTとの ...

ReferItGame

📅 2022/7/25 · ☕ 1 min read

画像-参照表現におけるデータセット割と大きいデータセットみたい the game has produced a dataset containing 130,525 expressions, referring to 96,654 distinct objects, in 19,894 photographs of natural scenes. ゲーム形式でアノテーションされるアノテータは二人二人でアノテーションを行うまずプレイヤーAがキャプションを考える次にもうひとりのプレイヤーBがそのキャプションが正しいかを当てる BはAのキャプションが指している物体をクリ ...

PCA Color Augmentation (PCACA)

📅 2022/7/25 · ☕ 1 min read

AlexNetで使われたらしいData augumentation手法そんなに使われてるイメージはない. 古代の手法？？ Fancy PCA / PCACAとも言うらしい？(要出典) 画像中の色の分布を考慮したデータ拡張ができる例えば, 明るいところは明るく, 暗いところは暗く調節できる流れは簡単

C \times H \times W

をflattenして,

C \times H W

にする各チャネ ...

NTK

📅 2022/7/17 · ☕ 1 min read

Neural Tangent Kernel 以下に示すようなカーネル

k_{NTK} (x_{i}, x_{j}) = E_{θ \sim \N} ⟨ \frac{\partial f (x_{i}; θ)}{\partial θ}, \frac{\partial f (x_{j}; θ)}{\partial θ} ⟩

特に, 入力をhypersphereに限定すると, MLPのNTKは

h_{NTK} (x_{i}^{⊤} x_{j})

と内積の形で書ける幅が無限にデカイ全結合層を考えると, 重みはほとんど初期値の近くしか動かず, このモデルはNTKによるカーネル回帰と同じ挙動をする(らしい) なので, NNの解析がかな ...