行李の底に収めたり[YuWd]

残差接続

📅 2022/7/5 · ☕ 1 min read

残差の何がうれしいか？そのモジュールが特徴量変換器として必要なければスキップすることができる言い換えれば, 恒等変換が起点となるので, 恒等写像が簡単に実現できる ...

tex

📅 2022/7/1 · ☕ 1 min read

\setlength{\baselineskip}{10pt} で「行間 + 文字の高さ」が10ptになる ...

#post

Hessianの固有値とフラットさ

📅 2022/6/30 · ☕ 1 min read

Hessianの固有値は等高線の密度を表現するどの方向に勾配が, どの程度早く移動するかなので, 最大固有値が小さいと損失平面はフラットになる (等高線の密度がどの方向にも低い) ...

CORS

📅 2022/6/29 · ☕ 1 min read

Cross-Origin Resource Sharing オリジンとは, プロトコル + ドメイン + ポートのことつまり, CORSとは同じオリジン間でのリソースの共有のことなので, オリジンが異なるリクエストは基本CORSエラーが起きる ...

「村上春樹、河合隼雄に会いにいく」

📅 2022/6/29 · ☕ 4 min read

p132-134 村上: ただ、ぼくが「ねじまき鳥クロニクル」に関して感ずるのは、何がどういう意味を持っているのかということが、自分でもまったくわからないということなのです。これまで書いてきたどの小説にもまして、わからない。たとえば、「世界の終りとハードボイルド・ワンダーランド」は、かなり同じような手法で書いたものではあるのですが、ある ...

Twitter

📅 2022/6/28 · ☕ 1 min read

AboutMeでTweetの有害性について書いたが, とても良く言語化されている以下の記事達を発見した. /shokai/承認欲求の刺激につながる機能を全て排除する /shokai/人間には承認欲求を刺激すると知能が下がるバグがある ...

#misc
#post

REINFORCE

📅 2022/6/27 · ☕ 1 min read

単純な方策勾配方法では

\nabla J (θ) = E_{τ_{θ}} [\sum_{t} G (τ) \nabla l o g π_{θ} (A_{t} | S_{t})]

が使われていたが, 全ての時刻

t

において収益

G (τ)

が一律に使用されているのが気がかりである重要なのは, 時刻

t

の行動の後の評価であるから,

[0, t)

の収益はノイズとなり得るそこで, REINFORCEでは以下のように勾配を変更する $$\nabla J(\theta) = \mathrm{E}_{\tau_\theta} \lbrack \sum_t G_t ...

【論文メモ】Do Transformer Modifications Transfer Across Implementations and Applications?

📅 2022/6/27 · ☕ 1 min read

Transformerの改善案は大量にあるが, 本当に有効なのはどれだけあるの？という論文結論 (有効な改善方法) 活性化関数: GLU+GeLU/Swish 正規化: RMS Norm パラメタ共有: デコーダの入出力における埋め込み表現を共有すると良いアーキテクチャ Mixture of Experts Transformer Synthesizer Product Key Memory ...

#論文

PPO

📅 2022/6/27 · ☕ 0 min read

...

#post

残差接続

📅 2022/7/5 · ☕ 1 min read

リプシッツ連続

📅 2022/7/4 · ☕ 1 min read

tex

📅 2022/7/1 · ☕ 1 min read

Hessianの固有値とフラットさ

📅 2022/6/30 · ☕ 1 min read

Sergey Levine

📅 2022/6/30 · ☕ 1 min read

CORS

📅 2022/6/29 · ☕ 1 min read

美味しい牡蠣フライの食べ方

📅 2022/6/29 · ☕ 1 min read

「村上春樹、河合隼雄に会いにいく」

📅 2022/6/29 · ☕ 4 min read

Twitter

📅 2022/6/28 · ☕ 1 min read

REINFORCE

📅 2022/6/27 · ☕ 1 min read

強化学習

📅 2022/6/27 · ☕ 2 min read

【論文メモ】Do Transformer Modifications Transfer Across Implementations and Applications?

📅 2022/6/27 · ☕ 1 min read

PPO

📅 2022/6/27 · ☕ 0 min read