【論文メモ】CLIP
· ☕ 1 min read
CLIPによって, image↔textの特徴量変換が容易になったと言える → ViLD: Open-vocabulary Object Detection via Vision and Language Knowledge Distillation ...


TD法
· ☕ 1 min read
DP法とMC法の中間 MCの場合, 終端までわかってないと使えなかった なので, 1ステップの状態に対してサンプリングを行い, 評価→行動 引用: ゼロから作るDeep Learning ❹ ―強化学習編 ...


DQN
· ☕ 1 min read
Q学習は推定値 Et を使って推定値 Et+1を更新する (これをブートストラップと呼ぶ) ゆえにQ学習は不安定なのだが, NNを加えると更に不安定になりやすい DQNでは, 推定値 Et と推定値 Et+1の相関が強くなりすぎないように「経験再生」と「ターゲットネットワーク」と呼ばれるものを導入する 経験再生 過去の状態や行動 ...

MC法
· ☕ 1 min read
モンテカルロ法 二次グリッド上の経路探索問題なら, 状態 s(i,j)の各マス 方策 πに準じて N回行動 aをサンプリング 移動先の状態 skと収益 Gt(sk)を記録 終端まで収益 Gt(sk)を計算 最後に各状態 sの収益 Gt(sk)の平均を取る [* 行動 aをサンプリングしている点に注 ...


AGI
· ☕ 1 min read
中国語の部屋 ...

DAgger algorithm
· ☕ 1 min read
状態: sS 行動: aA 方策: π π:SA と定義 累積的にデータセットを増やしながら方策を学習していく感じ 誤差が少ないらしい ...


三島由紀夫
· ☕ 1 min read
「私の鼻は大きくて魅力的でしよ」などと頑張つてゐる女の子より、美の規格を外れた鼻に絶望して、人生を呪つてゐる女の子のはうを愛します。それが「生きてゐる」といふことだからです。 ...

AtCoder Alert
· ☕ 1 min read
AtCoder Alert (https://yuiga.dev/atcoder-alert ) を久々にメンテした (2022-06-20) 勉強目的で作っただけで, 特に宣伝も何もしていないのに(当の本人すら使っていない), ここまで波及するとはビックリ 一つだけ仕込んでおいた"仕掛け"が機能したようだ 波及に気づいたときには仕掛け学的カタルシスを感じた 素直に言えば, うれしい気持ちでいっぱいである https://twitter.com/search?q=yuiga.dev%2Fatcoder-alert&src=typed_query&f=live 中身は単純 Nuxt + TS + ...