ヒルベルト空間 📅 2022/7/12 · ☕ 1 min read ベクトル空間 ⊃ 内積空間 ⊃ ヒルベルト空間 まず「ベクトル空間」について ベクトル空間の公理 (群論を想起すれば自然と思い出せる) 加法について閉じており, 零元, 逆元が存在 / 結合則・交換則が成立 スカラー積について閉じており, 零元, 逆元が存在 / 結合則が成立 スカラー積と加法の間で分配法則が成立 λ(a+b)=λa+λb こいつらが成り立てばまずはベク ... #数学 #post
ストレスなくpdbを使う方法 📅 2022/7/11 · ☕ 1 min read TL;DR pdbを使おうとすると, ブレークポイントが必要かどうかに拘らずcを入力する必要がある →ストレス😠 -m pdbだけでなく-c cをつけると自動でpdbモードに入ってくれる →ストレスフリー✨ 1 python -m pdb -c c main.py なので ~/.zshrcに 1 alias pdb="python -m pdb -c c" とでも書いておけば, デバッグしたいときにpythonをpdbに変えてしまうだけでいいの ... #python #post
noteのバックアップを取る 📅 2022/7/10 · ☕ 1 min read 現段階でそういうのはないらしい ということで作った → noteバックアップ 記事→ noteをバックアップ・エクスポートするWebサービスを作った (画像可・他ブログへの移行可) 「個人ブログ/Qiita/Zenn/Scrapbox/note 使い分け」を書いているときにふと思いついた そのまま勢いで日曜丸一日を潰して作ってしもうた 今 ... #misc #post
ar5ivのコードを読む 📅 2022/7/7 · ☕ 1 min read https://github.com/dginev/ar5iv 前提: arxivは投稿時, texをアップロードしなければならない ar5iv: 裏でクローラを回して, latexmlをキャッシュしてるだけっぽい 最終的にHTMLに変換されたものをzipで固めてサーバ上で管理 レンダリング時はzipを展開して独自のCSSで書き換えたものを表示 Rust製 ... #misc #論文 #Rust #post
方策エントロピー 📅 2022/7/7 · ☕ 1 min read 探索空間において探索されたことで更新される情報量 情報エントロピー, もしくは方策の対数尤度の期待値と考えればOK H(π(⋅|st))=∑a−π(a|s)logπ(a|s)=Ea∼π[−logπ(a|s)] 引用: https://horomary.hatenablog.com/entry/2020/12/20/115439 ... #強化学習 #post
SAC(Soft-Actor-Critic) 📅 2022/7/7 · ☕ 1 min read Actor-Critic型のSoft-Q学習 Soft-Q学習とは簡単に言うと, 報酬 + 方策エントロピーを目的関数に据える学習手法 SAC(Soft-Actor-Critic)の理論的背景はSoft-Q学習からきており、従来の目的関数に方策エントロピー項を加え、より多様な探索を可能にした手法です。 エントロピー項は正則化の役割 ... #強化学習 #post
WikipediaのTexをコピペする 📅 2022/7/6 · ☕ 1 min read WikipediaはMathJaxを使っているので(ホントか?), 画像を新規タブで開けばタイトルにtex表記が記述されている なので, 画像を新規タブで開く→ソースコードを表示→titleタグの部分をコピペすればOK 例 ⟨S⟩=sk1ek1sk2ek2⋯skmekm∣∃m∈N,(k1,…,km)∈Nm,ekj∈N,skj∈S. ... #misc #tex #post
Impact Factor 📅 2022/7/6 · ☕ 1 min read 学術雑誌の影響力を測る指標らしい (そんなのあるんだ) 今年の被引用数を過去2年分のPublicationで割る IFy=CitationsyPublicationsy−1+Publicationsy−2. ... #論文 #post
残差接続 📅 2022/7/5 · ☕ 1 min read 残差の何がうれしいか? そのモジュールが特徴量変換器として必要なければスキップすることができる 言い換えれば, 恒等変換が起点となるので, 恒等写像が簡単に実現できる ... #機械学習 #post
リプシッツ連続 📅 2022/7/4 · ☕ 1 min read 関数 f(x) がリプシッツ連続である ⇔\existk,∀x1,x2,|f(x1)−f(x2)|≤k|x1−x2| 機械学習において, 摂動 eを与えた場合の解析に良く用いられるword (ホントか?) すなわち, リプシッツ連続であれば, |f(x+e)−f(x)|≤k|e| が成り立つので, 摂動に強い分類器であると言える. ... #数学 #post
Hessianの固有値とフラットさ 📅 2022/6/30 · ☕ 1 min read Hessianの固有値は等高線の密度を表現する どの方向に勾配が, どの程度早く移動するか なので, 最大固有値が小さいと損失平面はフラットになる (等高線の密度がどの方向にも低い) ... #数学 #post