【論文メモ】HAMT - History Aware Multimodal Transformer for Vision-and-Language Navigation 📅 2022/6/26 · ☕ 1 min read パラメタの更新にActor-Criticを使用 強化学習と模倣学習の両方を組み込んでいる ... #論文
TD法 📅 2022/6/26 · ☕ 1 min read DP法とMC法の中間 MCの場合, 終端までわかってないと使えなかった なので, 1ステップの状態に対してサンプリングを行い, 評価→行動 引用: ゼロから作るDeep Learning ❹ ―強化学習編 ... #強化学習 #post
DQN 📅 2022/6/26 · ☕ 1 min read Q学習は推定値 $E_t$ を使って推定値 $E_{t+1}$を更新する (これをブートストラップと呼ぶ) ゆえにQ学習は不安定なのだが, NNを加えると更に不安定になりやすい DQNでは, 推定値 $E_t$ と推定値 $E_{t+1}$の相関が強くなりすぎないように「経験再生」と「ターゲットネットワーク」と呼ばれるものを導入する 経験再生 過去の状態や行動 ... #強化学習 #post
MC法 📅 2022/6/26 · ☕ 1 min read モンテカルロ法 二次グリッド上の経路探索問題なら, 状態 $s$ は $(i,j)$の各マス 方策 $\pi$に準じて $N$回行動 $a$をサンプリング 移動先の状態 $s_k$と収益 $G_t(s_k)$を記録 終端まで収益 $G_t(s_k)$を計算 最後に各状態 $s$の収益 $G_t(s_k)$の平均を取る [* 行動 $a$をサンプリングしている点に注 ... #強化学習 #post
【論文メモ】SOHO - Seeing Out of tHe bOx : End-to-End Pre-training for Vision-Language Representation Learning 📅 2022/6/26 · ☕ 1 min read クラスタリングの上位互換みたいなことをする パッチを特徴空間に飛ばす パッチに映る物体が同じ種類の物体なら, その特徴が同じクラスタidに含まれるように学習 ... #論文
【論文メモ】REVERIE - Remote Embodied Visual Referring Expression in Real Indoor Environments 📅 2022/6/26 · ☕ 0 min read ... #論文 #multi-modal #Vision-and-Language
DAgger algorithm 📅 2022/6/26 · ☕ 1 min read 状態: $s \in S$ 行動: $a \in A$ 方策: $\pi$ $\pi : S \rightarrow A$ と定義 累積的にデータセットを増やしながら方策を学習していく感じ 誤差が少ないらしい ... #模倣学習 #強化学習 #post
三島由紀夫 📅 2022/6/26 · ☕ 1 min read 「私の鼻は大きくて魅力的でしよ」などと頑張つてゐる女の子より、美の規格を外れた鼻に絶望して、人生を呪つてゐる女の子のはうを愛します。それが「生きてゐる」といふことだからです。 ... #post
AtCoder Alert 📅 2022/6/26 · ☕ 1 min read AtCoder Alert (https://yuiga.dev/atcoder-alert ) を久々にメンテした (2022-06-20) 勉強目的で作っただけで, 特に宣伝も何もしていないのに(当の本人すら使っていない), ここまで波及するとはビックリ 一つだけ仕込んでおいた"仕掛け"が機能したようだ 波及に気づいたときには仕掛け学的カタルシスを感じた 素直に言えば, うれしい気持ちでいっぱいである https://twitter.com/search?q=yuiga.dev%2Fatcoder-alert&src=typed_query&f=live 中身は単純 Nuxt + TS + ... #Typescript #misc #post
epipolar 📅 2022/6/26 · ☕ 1 min read 「カメラ $O_L$から見て $X_L$に物体が写っている」とき、「カメラ $O_R$ から見てどこに物体が写るか」の候補 https://qiita.com/Thought_Nibbler/items/9cb7c2637000eecc1a30 “平行な目"では, epipolar lineは平行になる https://gyazo.com/0357ac0708ea93a2036c5c88a388a321[https://gyazo.com/73088515f6591c4dc94313d88accc163] ... #CV #Homography #エピポーラ #post
AIC (赤池情報量基準) 📅 2022/6/25 · ☕ 1 min read 真の分布 $g$と得られた分布 $f$のKLダイバージェンスを最小化したい → ( $f$と $g$の交差エントロピー) - ( $g$のエントロピー) を最小化したい で, 真の分布 $g$が得られないので, 色々と強い仮定を連ねると, 例のあの式が導出されるみたい 割とAICの導出は難しい https://gyazo.com/fdf004f02bebf52589f0be3e740535f7 ... #統計 #機械学習 #情報エントロピー #post