<?xml version="1.0" encoding="utf-8" standalone="yes" ?>
<rss version="2.0" 
  xmlns:content="http://purl.org/rss/1.0/modules/content/" 
  xmlns:dc="http://purl.org/dc/elements/1.1/" 
  xmlns:atom="http://www.w3.org/2005/Atom" 
  xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" 
  xmlns:media="http://search.yahoo.com/mrss/">
  <channel>
    <title>論文 on 行李の底に収めたり[YuWd]</title>
    <link>https://yuiga.dev/blog/en/tags/%E8%AB%96%E6%96%87/</link>
    <description>Recent content in 論文 on 行李の底に収めたり[YuWd]</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>en</language>
    <copyright>©2026, All Rights Reserved</copyright>
    <lastBuildDate>Thu, 18 Jan 2024 02:35:54 +0900</lastBuildDate>
    
        <atom:link href="https://yuiga.dev/blog/en/tags/%E8%AB%96%E6%96%87/index.xml" rel="self" type="application/rss+xml" />
    

      
      <item>
        <title>【NeRF】動画から点群・メッシュ・任意視点動画を生成してみる</title>
        <link>https://yuiga.dev/blog/en/ja/posts/nerf%E5%8B%95%E7%94%BB%E3%81%8B%E3%82%89%E7%82%B9%E7%BE%A4%E3%83%A1%E3%83%83%E3%82%B7%E3%83%A5%E4%BB%BB%E6%84%8F%E8%A6%96%E7%82%B9%E5%8B%95%E7%94%BB%E3%82%92%E7%94%9F%E6%88%90%E3%81%97%E3%81%A6%E3%81%BF%E3%82%8B/</link>
        <pubDate>Thu, 18 Jan 2024 02:35:54 +0900</pubDate>
        
        <atom:modified>Thu, 18 Jan 2024 02:35:54 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/nerf%E5%8B%95%E7%94%BB%E3%81%8B%E3%82%89%E7%82%B9%E7%BE%A4%E3%83%A1%E3%83%83%E3%82%B7%E3%83%A5%E4%BB%BB%E6%84%8F%E8%A6%96%E7%82%B9%E5%8B%95%E7%94%BB%E3%82%92%E7%94%9F%E6%88%90%E3%81%97%E3%81%A6%E3%81%BF%E3%82%8B/</guid>
        <description>NeRFを使えば，点群・メッシュ・任意視点動画が作れるのでやってみた 今回は愛飲するRedBullを被写体にしてみるヨ！ 任意視点動画 (GIF版) 任意視点動画 (動画版) Your browser does not support the video tag. 点群 NeRFとnerfstudioについて簡潔に説明 ボリュームレンダリング ある点 $x$と方向 $d$を入力として $(c,\sigma)$を出力</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/a5b73842b81a0e44dd1a6551143567ba.gif" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>機械学習</category>
            
          
            
              <category>PyTorch</category>
            
          
            
              <category>CV</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>EMNLP 2023 参加録</title>
        <link>https://yuiga.dev/blog/en/ja/posts/emnlp_2023_%E5%8F%82%E5%8A%A0%E9%8C%B2/</link>
        <pubDate>Mon, 11 Dec 2023 03:04:16 +0900</pubDate>
        
        <atom:modified>Mon, 11 Dec 2023 03:04:16 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/emnlp_2023_%E5%8F%82%E5%8A%A0%E9%8C%B2/</guid>
        <description>EMNLP2023に行ってきた ポスター発表の画 面白かった発表 (マイベスト) Accelerating Toeplitz Neural Network with Constant-time Inference Complexity 会場で唯一見つけたSSM論文 (e.g., Hungry Hungry Hippos: Towards Language Modeling with State Space Models) Toeplitz Neural NetworksをSSMに変換し，閉形式で記述→DFTで効率的に解くというめちゃくちゃ胸躍る研究． 著者から直接聞いた話によると，最近Albert Guが出したMambaよりかなり</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/e7f46831e00c7125c14285d8e7c0dee5.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>機械学習</category>
            
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Hungry Hungry Hippos: Towards Language Modeling with State Space Models</title>
        <link>https://yuiga.dev/blog/en/ja/posts/hungry_hungry_hippos_towards_language_modeling_with_state_space_models/</link>
        <pubDate>Tue, 07 Mar 2023 18:44:30 +0900</pubDate>
        
        <atom:modified>Tue, 07 Mar 2023 18:44:30 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/hungry_hungry_hippos_towards_language_modeling_with_state_space_models/</guid>
        <description>この度，SONY様のnnablaチャンネルにH3の解説動画を寄稿しました． 本記事ではなく動画の視聴の方を推奨します． 概要 ICLR23 状態空間モデル(state-space model; SSM)は様々なモダリティにおいて有用性が検証されてきたが，未だ言語系においては確認できていない． また，SSMは $\mathcal{O}(L)$であるにも拘ら</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/593b6638afd19e307c9e5d9b99e075ef.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>状態空間モデル</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】LoRA: Low-Rank Adaptation of Large Language Models</title>
        <link>https://yuiga.dev/blog/en/ja/posts/lora_low-rank_adaptation_of_large_language_models/</link>
        <pubDate>Sun, 12 Feb 2023 21:20:55 +0900</pubDate>
        
        <atom:modified>Sun, 12 Feb 2023 21:20:55 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/lora_low-rank_adaptation_of_large_language_models/</guid>
        <description>ICLR22 大規模モデルを高速かつ低消費メモリでfine-tuningする新たな手法 HypernetworksのようにTransformerの各層に学習可能なパラメタを挿入する (Adaptation層) しかし，重みを固定するにしてもAdaptation層を学習させるためにはGPUに載せないと意味ないので，結局時間が掛かってしまう</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/4947500243d02eb19b59248a39f59451.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】On the Versatile Uses of Partial Distance Correlation in Deep Learning</title>
        <link>https://yuiga.dev/blog/en/ja/posts/on_the_versatile_uses_of_partial_distance_correlation_in_deep_learning/</link>
        <pubDate>Fri, 16 Dec 2022 19:07:36 +0900</pubDate>
        
        <atom:modified>Fri, 16 Dec 2022 19:07:36 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/on_the_versatile_uses_of_partial_distance_correlation_in_deep_learning/</guid>
        <description>はじめに ECCV22のbest paper https://twitter.com/eccvconf/status/1585560616688881664 #ECCV2022 Paper Awards pic.twitter.com/u9awGVCgSr &amp;mdash; European Conference on Computer Vision (ECCV) (@eccvconf) October 27, 2022 概要 二つのモデルの挙動を比較することは極めて重要 しかし, それぞれが異なるアーキテクチャにおけるモデルの比較方法は依然として研究が不十分. そこで, この論文では(Partial) Distance Correlationを機械学習に応用する手法を提案. (Partial) Distance Correlation</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/7cdf397dd1ebb647b1021c8751d7fd14.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Few-shot Relational Reasoning via Connection Subgraph Pretraining</title>
        <link>https://yuiga.dev/blog/en/ja/posts/few-shot_relational_reasoning_via_connection_subgraph_pretraining/</link>
        <pubDate>Wed, 16 Nov 2022 20:09:23 +0900</pubDate>
        
        <atom:modified>Wed, 16 Nov 2022 20:09:23 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/few-shot_relational_reasoning_via_connection_subgraph_pretraining/</guid>
        <description>はじめに NeurIPS22 Few-shotにおける knowledge graph completion task を行う 上図のように, Background KG (knowledge graph)とsupport setが与えられた状態で, Query setのrelationを推論するタスク Connection Subgraph Reasoner (CSR)を提案 Few-shot KG Completion KGは $\mathcal{G} = (\mathcal{E}, \mathcal{R}, \mathcal{T}) $で表される ここで, $\mathcal{E}, \mathcal{R}$はそれぞれentityとrelationで, $\mathcal{T</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/62a514d5e634122d220faafc5beed34d.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Deep Learning without Shortcuts: Shaping the Kernel with Tailored Rectifiers</title>
        <link>https://yuiga.dev/blog/en/ja/posts/deep_learning_without_shortcuts_shaping_the_kernel_with_tailored_rectifiers/</link>
        <pubDate>Wed, 02 Nov 2022 10:16:11 +0900</pubDate>
        
        <atom:modified>Wed, 02 Nov 2022 10:16:11 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/deep_learning_without_shortcuts_shaping_the_kernel_with_tailored_rectifiers/</guid>
        <description>はじめに ICLR22 [paper] 深層学習において, 残差接続は不可欠な存在となりつつある 残差接続により, より深い層数のNNを実現できるようになった 残差接続に対する解釈の矛盾 昨今の研究により残差接続は比較的浅い層をアンサンブルするような効果があるとの見方が強まっている しかし, 「深層」学習という名が体を表す通り, 一般には「層を増やす」ことがモデ</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/34780be6ef367905dbf7d1ea9ee4c41f.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>機械学習</category>
            
          
            
              <category>数学</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Lifting the Curse of Multilinguality by Pre-training Modular Transformers</title>
        <link>https://yuiga.dev/blog/en/ja/posts/lifting_the_curse_of_multilinguality_by_pre-training_modular_transformers/</link>
        <pubDate>Wed, 19 Oct 2022 19:16:15 +0900</pubDate>
        
        <atom:modified>Wed, 19 Oct 2022 19:16:15 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/lifting_the_curse_of_multilinguality_by_pre-training_modular_transformers/</guid>
        <description>NACCL22 多言語を扱うモデルにおいて, 言語の数を増やせば増やすほど精度が下がる「the curse of multilinguality」(多言語の呪い)という現象が存在する この「多言語の呪い」を対処するモデルとしてX-MODを提案 概略 言語ごとにbottleneck型のモジュールを用意し, 言語ごとにスイッチさせる それ故, 拡張は容易で, 学習・推</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/58739452292513463d6e94cead40aec8.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>NLP</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】SimCSE</title>
        <link>https://yuiga.dev/blog/en/ja/posts/simcse/</link>
        <pubDate>Tue, 18 Oct 2022 19:34:11 +0900</pubDate>
        
        <atom:modified>Tue, 18 Oct 2022 19:34:11 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/simcse/</guid>
        <description>ENMLP21 Supervised SimCSE 含意関係にある文を正例として対照学習 NLIデータセット Unsupervised SimCSE 同じ文を二回埋め込んで対照学習 dropoutの影響で微かに異なる二つのベクトルに対して対照学習 引用: https://www.slideshare.net/DeepLearningJP2016/dlsimcse-simple-contrastive-learning-of-sentence-embeddings-emnlp-2021</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/54da476b5c4176cec254b0759b90b569.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>自己教師あり学習</category>
            
          
            
              <category>NLP</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Can Neural Nets Learn the Same Model Twice? Investigating Reproducibility and Double Descent from the Decision Boundary Perspective</title>
        <link>https://yuiga.dev/blog/en/ja/posts/can_neural_nets_learn_the_same_model_twice_investigating_reproducibility_and_double_descent_from_the_decision_boundary_perspective/</link>
        <pubDate>Sat, 24 Sep 2022 02:31:18 +0900</pubDate>
        
        <atom:modified>Sat, 24 Sep 2022 02:31:18 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/can_neural_nets_learn_the_same_model_twice_investigating_reproducibility_and_double_descent_from_the_decision_boundary_perspective/</guid>
        <description>はじめに CVPR22 決定境界を描画し, 再現性と汎化性について定量的に考察した論文 決定境界の描画 (領域の決定) 如何に決定境界を描画するかが重要になってくる その上でまず, データ多様体 $\mathcal{M}$の近傍(on-manifold)を取るのか, $\mathcal{M}$から離れた領域(off-manifold)を取るのかを考</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/d94928f2f96e141ad3a445ba86d6797c.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>CV</category>
            
          
            
              <category>機械学習</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Test-Time Training with Self-Supervision for Generalization under Distribution Shifts</title>
        <link>https://yuiga.dev/blog/en/ja/posts/test-time_training_with_self-supervision_for_generalization_under_distribution_shifts/</link>
        <pubDate>Mon, 19 Sep 2022 04:57:03 +0900</pubDate>
        
        <atom:modified>Mon, 19 Sep 2022 04:57:03 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/test-time_training_with_self-supervision_for_generalization_under_distribution_shifts/</guid>
        <description>PMLR20 trainとtestで分布が違う場合の再学習手法TTT(Test-Time Training)を提案 まずは普通に学習 次にモデルを前半(A)と後半(B)に分けて, 元のA + 新しいB&amp;rsquo; のモデルで自己教師あり学習を行う headを取っ替えるイメージ (B→B&#39;) このとき, testサンプルを使用して自己教師あり学習を行う</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Energy-Based Learning for Scene Graph Generation</title>
        <link>https://yuiga.dev/blog/en/ja/posts/energy-based_learning_for_scene_graph_generation/</link>
        <pubDate>Mon, 19 Sep 2022 00:57:50 +0900</pubDate>
        
        <atom:modified>Mon, 19 Sep 2022 00:57:50 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/energy-based_learning_for_scene_graph_generation/</guid>
        <description>はじめに Energy Based Modelを用いて画像からscene graphを生成する手法(フレームワーク)を提案 既存手法は次のようにクロスエントロピーでscene graphを生成する $$\log p(SG|I) = \sum_{i \in O} \log p(o_i| I) + \sum_{j \in R} \log p(r_j | I).$$ このとき, object $O$とrelation $R$が互いに独立に計算されている ここが問題で, 本来なら互いに弱い依存性があるはず し</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/b6fd8fd063fe798fec0b02015c31b045.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>Graph</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Your classifier is secretly an energy based model and you should treat it like one</title>
        <link>https://yuiga.dev/blog/en/ja/posts/your_classifier_is_secretly_an_energy_based_model_and_you_should_treat_it_like_one/</link>
        <pubDate>Sun, 28 Aug 2022 00:57:38 +0900</pubDate>
        
        <atom:modified>Sun, 28 Aug 2022 00:57:38 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/your_classifier_is_secretly_an_energy_based_model_and_you_should_treat_it_like_one/</guid>
        <description>分類問題について, 生成モデルで用いられるEnergy Based Modelに基づいた学習手法を提案 一般的な学習 あるNNを $f_\theta(x)$とすると, 出力の $y$番目を $f_\theta(x)[y\rbrack$として, softmaxは以下のように表される $$p_{\theta}(y|{\bf x}) = \frac{\exp{\left(f_{\theta}({\bf x})[y\rbrack \right)} } { \sum_{y^{\prime}}\exp{\left(f_{\theta}({\bf x})[y^{\prime}\rbrack \right)} }$$ ここで, Energy Based Modelでは $$p_{\theta}(\boldsymbol{x},y) = \frac{\textrm{exp}(-E_{\theta}(\boldsymbol{x},y))}{Z_{\theta}}$$ と定義される</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/cb2e04dc6fbbdb969522c4df27d6647c.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based Visual Question Answering</title>
        <link>https://yuiga.dev/blog/en/ja/posts/mukea_multimodal_knowledge_extraction_and_accumulation_for_knowledge-based_visual_question_answering/</link>
        <pubDate>Wed, 24 Aug 2022 04:13:02 +0900</pubDate>
        
        <atom:modified>Wed, 24 Aug 2022 04:13:02 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/mukea_multimodal_knowledge_extraction_and_accumulation_for_knowledge-based_visual_question_answering/</guid>
        <description>CVPR22 タスク: KB-VQA 質問画像に含まれていない知識を要する質問に回答するタスク 例えば, 以下のVQAでは, 外部知識=kawasakiを使わないと回答できない 新規性 知識グラフの構築は行わない scene graphを作るのではなく, 画像由来のHead Entity (領域画像)と, 言語由来のTail Entity (後述)について, (entity, relation, entity)のtripletを用い</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/51294e3560f51ee9d6d93c80b996f856.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>Vision-and-Language</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Generating Semantically Precise Scene Graphs from Textual Descriptions for Improved Image Retrieval</title>
        <link>https://yuiga.dev/blog/en/ja/posts/generating_semantically_precise_scene_graphs_from_textual_descriptions_for_improved_image_retrieval/</link>
        <pubDate>Wed, 24 Aug 2022 02:21:50 +0900</pubDate>
        
        <atom:modified>Wed, 24 Aug 2022 02:21:50 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/generating_semantically_precise_scene_graphs_from_textual_descriptions_for_improved_image_retrieval/</guid>
        <description>Stanford Scene Graph Parserの論文 (ACL 2015) 一応, scene graphを自動化してimage retrievalできるようにしようという趣旨 https://nlp.stanford.edu/software/scenegraph-parser.shtml 流れ ①Universal Dependenciesを一部修正したものをsemantic graphとして生成 a lot of 等のquantificational modifiersの修正 代名詞の解釈 複数名詞への対応 → ノー</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>NLP</category>
            
          
            
              <category>Vision-and-Language</category>
            
          
            
              <category>Graph</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Neural Networks and the Chomsky Hierarchy</title>
        <link>https://yuiga.dev/blog/en/ja/posts/neural_networks_and_the_chomsky_hierarchy/</link>
        <pubDate>Wed, 17 Aug 2022 22:33:24 +0900</pubDate>
        
        <atom:modified>Wed, 17 Aug 2022 22:33:24 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/neural_networks_and_the_chomsky_hierarchy/</guid>
        <description>Chomsky Hierarchyにおいて, 各モデルがどのクラスに属するかを実験的に示した 各階層はオートマトンの性質と紐付いている RNNやTransformerは無限ステップにおいてチューリング完全であることが理論的に証明されているが, 有限ステップにおいて各モデルがどのクラスに属するかの研究は未だ発展中 例えば, Transformer</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/8ce2bd1fe0a634a3e3944e59dc8ad1de.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Graphormer: Do Transformers Really Perform Bad for Graph Representation?</title>
        <link>https://yuiga.dev/blog/en/ja/posts/graphormer_do_transformers_really_perform_bad_for_graph_representation/</link>
        <pubDate>Tue, 16 Aug 2022 20:46:37 +0900</pubDate>
        
        <atom:modified>Tue, 16 Aug 2022 20:46:37 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/graphormer_do_transformers_really_perform_bad_for_graph_representation/</guid>
        <description>はじめに Transformerをベースとしたグラフ学習手法 (NeurIPS 2021) 構成要素は三つ Centrality Encoding Spatial Encoding Edge Encoding (in the Attention) 特筆すべき点として, この手法はGINやGCN, それからGraphSAGEといったGNN手法を一般化したものとなっているらしい Do Transformers Really Perform Bad for Graph Representation? 論文メモ 構成要素1. Centrality Encoding モチベーション Node Centrality, つまりノードがどれほど別のノードとつながって</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/78a900d78ecdefbbad1d5b4c1609f9be.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>Graph</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】SPICE: Semantic Propositional Image Caption Evaluation</title>
        <link>https://yuiga.dev/blog/en/ja/posts/spice_semantic_propositional_image_caption_evaluation/</link>
        <pubDate>Tue, 16 Aug 2022 20:46:30 +0900</pubDate>
        
        <atom:modified>Tue, 16 Aug 2022 20:46:30 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/spice_semantic_propositional_image_caption_evaluation/</guid>
        <description>評価指標SPICEの論文 (ECCV 2016) BLEUなどはn-gramの重なりにsensitiveで, 真の意味でsemanticsを評価しているとは言えない そこで, scene graphを用いた評価指標SPICEを提案 実際, 画像キャプショニングモデルではよく見かける指標となってきた 流れ ① 複数キャプションからscene graphを生成 scene graph</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/86b2eefc57b88f16f77dc26d56a26094.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>NLP</category>
            
          
            
              <category>Vision-and-Language</category>
            
          
            
              <category>Graph</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】OTTER: Data Efficient Language-Supervised Zero-Shot Recognition with Optimal Transport Distillation</title>
        <link>https://yuiga.dev/blog/en/ja/posts/otter_data_efficient_language-supervised_zero-shot_recognition_with_optimal_transport_distillation/</link>
        <pubDate>Wed, 10 Aug 2022 18:01:53 +0900</pubDate>
        
        <atom:modified>Wed, 10 Aug 2022 18:01:53 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/otter_data_efficient_language-supervised_zero-shot_recognition_with_optimal_transport_distillation/</guid>
        <description>モチベーション CLIPは単位行列を教師として学習する → バッチ内の負例同士にゆるい相関があった場合, 負例を全て0として学習するのは違うよね → 最適輸送問題を解いたものを教師として活用しよう OTTER (Optimal TransporT distillation for Efficient zero-shot Recognition) を提案 Prototypical Contrastive Learning of Unsupervised Representationsと若干同じ感じ loss InfoNCEを拡張して $$\mathcal{L}_v = -\frac{1}{N} \sum_{i=1}^N \sum_{j=1}^N [\alpha I_{ij} + (1-\alpha) M^{v}_{ij}\rbrack \log p_v(\mathbf{z}_i^v, \mathbf{z}_j^t;\tau)$$ とする イ</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/4dbdcb91a7bb20347b521aeccd47c222.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>Vision-and-Language</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】TokenGT: Pure Transformers are Powerful Graph Learners</title>
        <link>https://yuiga.dev/blog/en/ja/posts/tokengt_pure_transformers_are_powerful_graph_learners/</link>
        <pubDate>Tue, 02 Aug 2022 18:58:30 +0900</pubDate>
        
        <atom:modified>Tue, 02 Aug 2022 18:58:30 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/tokengt_pure_transformers_are_powerful_graph_learners/</guid>
        <description>グラフをそのままTransformerにブチこむ手法 GNNより帰納バイアスが少ないが, GNNよりも良い精度を達成 入力について まず, ノードとエッジをそれぞれ独立なものとして捉え, それぞれを同等にトークン $X$とする そのトークンに, ノードなのかエッジなのかを判別するType Identifiersをconcatして入力 トーク</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/cfa68a924d0c584ebaa51ff8f6500c78.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>Graph</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Why do tree-based models still outperform deep learning on tabular data?</title>
        <link>https://yuiga.dev/blog/en/ja/posts/why_do_tree-based_models_still_outperform_deep_learning_on_tabular_data/</link>
        <pubDate>Mon, 01 Aug 2022 20:18:34 +0900</pubDate>
        
        <atom:modified>Mon, 01 Aug 2022 20:18:34 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/why_do_tree-based_models_still_outperform_deep_learning_on_tabular_data/</guid>
        <description>なぜテーブルデータではGBDTなどの決定木ベース手法がNNよりも強いのかについての論文 １つ目: NNは高周波数成分の学習に弱い なので, 飛び値的なデータに弱い 一方決定木ベース手法は領域を長方形に区切ってるだけなので飛び値的なデータに強い 詳しくは拙作→決定木をフルスクラッチで書けるようになろう (CART) NeRFやPerceiver:</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/363739123631883a83dfad7683ecaf80.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Deformable Attention Transformer</title>
        <link>https://yuiga.dev/blog/en/ja/posts/deformable_attention_transformer/</link>
        <pubDate>Mon, 01 Aug 2022 20:18:22 +0900</pubDate>
        
        <atom:modified>Mon, 01 Aug 2022 20:18:22 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/deformable_attention_transformer/</guid>
        <description>詳しくは輪講スライド Deformable Conv のDeformと同じ grid上のpositionに対して, offset分positionをずらしてAttention 正式なoffsetはbilinear補完によって求める オブジェクトごとに受容野を歪めることができる</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/ed28dd358094cab2a52be493c6b0b5f2.jpeg" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Prototypical Contrastive Learning of Unsupervised Representations</title>
        <link>https://yuiga.dev/blog/en/ja/posts/prototypical_contrastive_learning_of_unsupervised_representations/</link>
        <pubDate>Mon, 01 Aug 2022 20:17:52 +0900</pubDate>
        
        <atom:modified>Mon, 01 Aug 2022 20:17:52 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/prototypical_contrastive_learning_of_unsupervised_representations/</guid>
        <description>輪講スライド 背景 Instance-wiseな教師なし表現学習 : 加⼯された画像(instance)のペアが同じ元画像に由来するかを識別 MoCo SimCLR SimSiam など Instance-wiseな⼿法における２つの問題点 1- 低次元の特徴だけで識別できるため, 識別はNNにとって簡単なタスク → **⾼密度な情報をエンコードしているとは⾔い難い ** 2- ペア間</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/bced9edbf537ec3979092f1a139160a0.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>対照学習</category>
            
          
            
              <category>自己教師あり学習</category>
            
          
            
              <category>EMアルゴリズム</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】GSAM - Surrogate Gap Minimization Improves Sharpness-Aware Training</title>
        <link>https://yuiga.dev/blog/en/ja/posts/gsam_-_surrogate_gap_minimization_improves_sharpness-aware_training/</link>
        <pubDate>Mon, 01 Aug 2022 20:16:49 +0900</pubDate>
        
        <atom:modified>Mon, 01 Aug 2022 20:16:49 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/gsam_-_surrogate_gap_minimization_improves_sharpness-aware_training/</guid>
        <description>はじめに SAMの改良 (SAM : Sharpness-Aware Minimization) Surrogate Gap Minimization Improves Sharpness-Aware Training 論文メモ 問題提起 SAMの計算式では, 本当にフラットな損失点を見つけているとは言えない $$L_\mathcal{S}^\text{SAM}(\mathbf{w}) \triangleq \max_{|\mathbf{\epsilon}|_p\leq\rho} L_\mathcal{S}(\mathbf{w}+\mathbf{\epsilon})$$ 例えば下の図では, 近傍 $f_p$について最適化すると, SAMの場合, 青に収束してしまう危険がある 本当に見るべきは以下に定義するsurrogate gap $h(x)$ $$h(x) := f_p(x) - f(x)$$ surrogate gap $h(x)$については, H</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/4cd6d3940c35b980ad4c184f20793cc2.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>Optimizer</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>Toronto Paper Matching System</title>
        <link>https://yuiga.dev/blog/en/ja/posts/toronto_paper_matching_system/</link>
        <pubDate>Sun, 31 Jul 2022 17:44:35 +0900</pubDate>
        
        <atom:modified>Sun, 31 Jul 2022 17:44:35 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/toronto_paper_matching_system/</guid>
        <description></description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>misc</category>
            
          
            
              <category>論文</category>
            
          
            
              <category>post</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】RegionCLIP: Region-based Language-Image Pretraining</title>
        <link>https://yuiga.dev/blog/en/ja/posts/regionclip_region-based_language-image_pretraining/</link>
        <pubDate>Sat, 30 Jul 2022 23:26:06 +0900</pubDate>
        
        <atom:modified>Sat, 30 Jul 2022 23:26:06 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/regionclip_region-based_language-image_pretraining/</guid>
        <description>問題点: CLIPは画像全体を用いるため, 物体検出には向かない そこで, 本論文ではCLIPをRegion-text matchingへと拡張した CLIPを用いた open-vocabularyな物体検出タスクが行える open-vocabulary object detection 関連研究としてViLDを挙げている ViLD: Open-vocabulary Object Detection via Vision and Language Knowledge Distillation CVPR22 流れ [RPN](Resion Proposal Network)を用いて候補領域を探す RP</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/01321d31bb6357228246b26b5d849e7b.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】When Shift Operation Meets Vision Transformer: An Extremely Simple Alternative to Attention Mechanism</title>
        <link>https://yuiga.dev/blog/en/ja/posts/when_shift_operation_meets_vision_transformer_an_extremely_simple_alternative_to_attention_mechanism/</link>
        <pubDate>Thu, 28 Jul 2022 23:34:35 +0900</pubDate>
        
        <atom:modified>Thu, 28 Jul 2022 23:34:35 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/when_shift_operation_meets_vision_transformer_an_extremely_simple_alternative_to_attention_mechanism/</guid>
        <description>Attentionはglobalでdynamic dynamicについては On the Connection between Local Attention and Dynamic Depth-wise Convolution しかし global→SwinTransformerを見るとそこまでViTの精度に関係なさそう dynamic→MLP-Mixerを見ると, MLPはstaticなので精度に関係なさそう そこでShiftViTを提案 上図のように, 入力の</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/65023d8e54cf1c22784683ad5a1b1c80.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】BoxInst: High-Performance Instance Segmentation with Box Annotations</title>
        <link>https://yuiga.dev/blog/en/ja/posts/boxinst_high-performance_instance_segmentation_with_box_annotations/</link>
        <pubDate>Mon, 25 Jul 2022 12:31:50 +0900</pubDate>
        
        <atom:modified>Mon, 25 Jul 2022 12:31:50 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/boxinst_high-performance_instance_segmentation_with_box_annotations/</guid>
        <description>Instance SegmentationをBBOXのみで学習するモデルを提案 BBOXのみで学習するのでアノテーションが必要ないのが利点 新たな損失を提案 Projection Loss Pairwise affinity Loss todo</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Shifting More Attention to Visual Backbone: Query-modulated Refinement Networks for End-to-End Visual Grounding</title>
        <link>https://yuiga.dev/blog/en/ja/posts/shifting_more_attention_to_visual_backbone_query-modulated_refinement_networks_for_end-to-end_visual_grounding/</link>
        <pubDate>Mon, 25 Jul 2022 12:30:45 +0900</pubDate>
        
        <atom:modified>Mon, 25 Jul 2022 12:30:45 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/shifting_more_attention_to_visual_backbone_query-modulated_refinement_networks_for_end-to-end_visual_grounding/</guid>
        <description>通常のV&amp;amp;Lモデルでは, 画像のバックボーンネットワークは言語特徴量を使用しない そのようなモデルでは, 「画像にりんごはいくつあるか？」などといったVQAタスクすら解けない(可能性が高い) そこで, SwinTransformerを拡張し, 各ステージで言語特徴量をspatial / channel方向にmixしながら推論し</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/ac556a8dc0097b4aca251a866ea6d0e4.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>Vision-and-Language</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation</title>
        <link>https://yuiga.dev/blog/en/ja/posts/blip_bootstrapping_language-image_pre-training_for_unified_vision-language_understanding_and_generation/</link>
        <pubDate>Mon, 25 Jul 2022 00:48:05 +0900</pubDate>
        
        <atom:modified>Mon, 25 Jul 2022 00:48:05 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/blip_bootstrapping_language-image_pre-training_for_unified_vision-language_understanding_and_generation/</guid>
        <description>提案手法は主に２つの機構で構成される Multimodal mixture of Encoder-Decoder (MED) Captioning and Filtering (CapFilt): CLIPの使用するデータセットはnoisy なので, キャプションの取捨選択を自動で行う機構を導入 流れ ノイズを含む元のデータセットでMEDを学習 事前学習されたMEDを用いてCapFiltを実行 CapFiitによって得られたデータセットを用いて再度MEDを学習 MED Image-TextContrastiveLoss(ITC) 画像特徴</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/782b3acbf1406632a3ae1d16055465e8.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>Vision-and-Language</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Large-Scale Adversarial Training for Vision-and-Language Representation Learning</title>
        <link>https://yuiga.dev/blog/en/ja/posts/large-scale_adversarial_training_for_vision-and-language_representation_learning/</link>
        <pubDate>Thu, 21 Jul 2022 11:30:58 +0900</pubDate>
        
        <atom:modified>Thu, 21 Jul 2022 11:30:58 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/large-scale_adversarial_training_for_vision-and-language_representation_learning/</guid>
        <description>各モダリティについて摂動を加えて学習</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/31a194426843591e38a951e1d2399b6a.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】On the Connection between Local Attention and Dynamic Depth-wise Convolution</title>
        <link>https://yuiga.dev/blog/en/ja/posts/on_the_connection_between_local_attention_and_dynamic_depth-wise_convolution/</link>
        <pubDate>Mon, 18 Jul 2022 00:18:19 +0900</pubDate>
        
        <atom:modified>Mon, 18 Jul 2022 00:18:19 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/on_the_connection_between_local_attention_and_dynamic_depth-wise_convolution/</guid>
        <description>AttentionとDepthwise-Conv(DwConv)は似ているよ, という論文 上図は画像をflatten or patchifyしたものがspatial方向であると捉えればOK (a): 畳み込み ある区間の画素値と複数チャネルを使って一つの埋め込みを生成 (c): DepthWise と local attention ある一つのチャネルに対して, 区間の画素値のみから生成 (Poin</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/bc3dcee373339aaa100e9a83acdb58de.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem</title>
        <link>https://yuiga.dev/blog/en/ja/posts/word_tour_one-dimensional_word_embeddings_via_the_traveling_salesman_problem/</link>
        <pubDate>Sun, 17 Jul 2022 22:14:54 +0900</pubDate>
        
        <atom:modified>Sun, 17 Jul 2022 22:14:54 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/word_tour_one-dimensional_word_embeddings_via_the_traveling_salesman_problem/</guid>
        <description>単語の埋め込みを一次元で行う TSPを解くだけ 論文中ではWord Tour と呼んでいる GBDT等の決定木ベース手法が解釈しやすいようにWord Tour を使うとうまくいく場合があるらしい 例えば, NNで特徴量を作った後に, Word Tourでクラスタの重心を一次元に埋め込んでGBDTに掛ける的な https://twitter.com/Py2K4/status/1545215820413865985</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Modeling the Distribution of Normal Data in Pre-Trained Deep Features for Anomaly Detection</title>
        <link>https://yuiga.dev/blog/en/ja/posts/modeling_the_distribution_of_normal_data_in_pre-trained_deep_features_for_anomaly_detection/</link>
        <pubDate>Fri, 15 Jul 2022 00:54:41 +0900</pubDate>
        
        <atom:modified>Fri, 15 Jul 2022 00:54:41 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/modeling_the_distribution_of_normal_data_in_pre-trained_deep_features_for_anomaly_detection/</guid>
        <description>モデルを学習させることなく, 異常検知を行う 流れ 事前学習済みEfficientNetに正常データを流す モデルの中間層で抽出された正常データの特徴量を, 各層ごとに多次元正規分布で近似 得られた分布を正常データの分布と仮定し, マハラノビス距離を用いて異常検知 例えば下図だと, 32x112x112の特徴量をGlobal Average Pooli</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/b26ad32912d947cf00f75b896d7eec8c.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>異常検知</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Representation Learning on Graphs with Jumping Knowledge Networks</title>
        <link>https://yuiga.dev/blog/en/ja/posts/representation_learning_on_graphs_with_jumping_knowledge_networks/</link>
        <pubDate>Tue, 12 Jul 2022 18:10:21 +0900</pubDate>
        
        <atom:modified>Tue, 12 Jul 2022 18:10:21 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/representation_learning_on_graphs_with_jumping_knowledge_networks/</guid>
        <description>概要 隣接ノードからのaggregationだけでは, k層のGCNはただのrandom-walkと変わらない r.w = random-walk 濃い色のノードはInfluence Probabilityの高いもの 各ノードの影響範囲が大きくてもダメだし, 小さくてもダメ なので, 各層の出力をすべて使用し, モデルに適切な影響半径を決めさせるJumping Knowledge Ne</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/b96faebf90a2a74f5d8bc23078a86bd5.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>GNN</category>
            
          
            
              <category>Graph</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Fourier Features Let Networks Learn High Frequency Functions in Low Dimensional Domains</title>
        <link>https://yuiga.dev/blog/en/ja/posts/fourier_features_let_networks_learn_high_frequency_functions_in_low_dimensional_domains/</link>
        <pubDate>Tue, 12 Jul 2022 16:57:14 +0900</pubDate>
        
        <atom:modified>Tue, 12 Jul 2022 16:57:14 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/fourier_features_let_networks_learn_high_frequency_functions_in_low_dimensional_domains/</guid>
        <description>NeRFで用いられるPositional Encodingについて, NTKによる分析を行った論文 $$\gamma(t) = (\sin(2^0t\pi), \cos(2^0t\pi), \cdots, \sin(2^Lt\pi), \cos(2^Lt\pi))$$ NeRFのPositional Encoding をバンドパスフィルタと考える 低周波数成分→高周波数成分への写像関数の学習 Positional Encodingを入れるかどうかでだいぶ精度が変わる 例えば(b)の場合, (x,y) の座標値からRGBを復元するML</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/9988a81fa86084c344318dde32561995.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Perceiver: General Perception with Iterative Attention</title>
        <link>https://yuiga.dev/blog/en/ja/posts/perceiver_general_perception_with_iterative_attention/</link>
        <pubDate>Mon, 11 Jul 2022 17:52:48 +0900</pubDate>
        
        <atom:modified>Mon, 11 Jul 2022 17:52:48 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/perceiver_general_perception_with_iterative_attention/</guid>
        <description>Transformer を改善 Qを潜在変数とすることで, $L^2$の呪いから解放してあげる 音声系 / 時系列予測 にも適してる 潜在変数をcentroidとして, 高次元の入力 $x$ をend-to-endでクラスタリングしてるとも捉えうる つまり, 入力 $x$をタグ付けしてるイメージ (と論文内で言っている) Positional Encoding 普通のPEの代わりに, フーリエ変換した特徴量を使</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/9eb83752f74bf34478003e1553273308.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】NeRF</title>
        <link>https://yuiga.dev/blog/en/ja/posts/nerf/</link>
        <pubDate>Mon, 11 Jul 2022 17:34:01 +0900</pubDate>
        
        <atom:modified>Mon, 11 Jul 2022 17:34:01 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/nerf/</guid>
        <description>Positional Encoding 低周波成分である $(x,y,z,\theta,\phi)$から高周波成分である $(R,G,B,D)$を復元するため, 以下に示すPositional Encodingを通したあとにMLPに入力 $$\gamma(t) = (\sin(2^0t\pi), \cos(2^0t\pi), \cdots, \sin(2^Lt\pi), \cos(2^Lt\pi))$$ この機構をNTKによって実験した論文→ Fourier Features Let Networks Learn High Frequency Functions in Low Dimensional Domains このPositional Encodingはフーリエ特</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/b48cba676173ec2a3adeea0810d38fe5.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>CV</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】SAF: Sharpness Aware Training for Free</title>
        <link>https://yuiga.dev/blog/en/ja/posts/saf_sharpness_aware_training_for_free/</link>
        <pubDate>Thu, 07 Jul 2022 11:05:42 +0900</pubDate>
        
        <atom:modified>Thu, 07 Jul 2022 11:05:42 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/saf_sharpness_aware_training_for_free/</guid>
        <description>todo</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/ec3a2d5611391f7c23b578fa55d6a3d6.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>ar5ivのコードを読む</title>
        <link>https://yuiga.dev/blog/en/ja/posts/ar5iv%E3%81%AE%E3%82%B3%E3%83%BC%E3%83%89%E3%82%92%E8%AA%AD%E3%82%80/</link>
        <pubDate>Thu, 07 Jul 2022 11:05:35 +0900</pubDate>
        
        <atom:modified>Thu, 07 Jul 2022 11:05:35 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/ar5iv%E3%81%AE%E3%82%B3%E3%83%BC%E3%83%89%E3%82%92%E8%AA%AD%E3%82%80/</guid>
        <description>https://github.com/dginev/ar5iv 前提: arxivは投稿時, texをアップロードしなければならない ar5iv: 裏でクローラを回して, latexmlをキャッシュしてるだけっぽい 最終的にHTMLに変換されたものをzipで固めてサーバ上で管理 レンダリング時はzipを展開して独自のCSSで書き換えたものを表示 Rust製</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>misc</category>
            
          
            
              <category>論文</category>
            
          
            
              <category>Rust</category>
            
          
            
              <category>post</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigation</title>
        <link>https://yuiga.dev/blog/en/ja/posts/think_global_act_local_dual-scale_graph_transformer_for_vision-and-language_navigation/</link>
        <pubDate>Thu, 07 Jul 2022 02:01:33 +0900</pubDate>
        
        <atom:modified>Thu, 07 Jul 2022 02:01:33 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/think_global_act_local_dual-scale_graph_transformer_for_vision-and-language_navigation/</guid>
        <description>VLN-DUET 概要 localな情報とグラフを用いたglobalな情報の両方を統合してactionを決定する actionが決定されたら, Graphを動的に構築して, 移動先までの最短経路をワーシャルフロイドで探索 各ノードには, viewから得られた特徴量を埋め込み表現として保持する 行動 $a^\pi$は各ノードへの尤度によって表現され, ノ</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/84d55d864e6f3ddfa3da97d5ca443f27.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>Vision-and-Language</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Graph Transformer: A Generalization of Transformer Networks to Graphs</title>
        <link>https://yuiga.dev/blog/en/ja/posts/graph_transformer_a_generalization_of_transformer_networks_to_graphs/</link>
        <pubDate>Thu, 07 Jul 2022 01:57:04 +0900</pubDate>
        
        <atom:modified>Thu, 07 Jul 2022 01:57:04 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/graph_transformer_a_generalization_of_transformer_networks_to_graphs/</guid>
        <description>任意のGraphに適応可能な, 汎用Transformer Positional Encodingがラプラシアン行列の固有値で表現される ラプラシアン行列の固有値 $\lambda$は頻度・周波数的な側面を持つ → グラフ上のフーリエ変換・畳み込みでは $\lambda$が使われる (いつかまとめる→todo) todo https://arxiv.org/pdf/2012.09699v2.pdf</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/dd4db35c1c951feff89e00cc7143b6bc.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】ViLD: Open-vocabulary Object Detection via Vision and Language Knowledge Distillation </title>
        <link>https://yuiga.dev/blog/en/ja/posts/vild_open-vocabulary_object_detection_via_vision_and_language_knowledge_distillation/</link>
        <pubDate>Thu, 07 Jul 2022 01:18:43 +0900</pubDate>
        
        <atom:modified>Thu, 07 Jul 2022 01:18:43 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/vild_open-vocabulary_object_detection_via_vision_and_language_knowledge_distillation/</guid>
        <description>Open-Vocabulary (任意テキスト入力)な物体検出モデル classifierがCLIP特徴量になっている</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/9d44365d0e327c8592689a058e26f5e1.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】SwinIR: Image Restoration Using Swin Transformer</title>
        <link>https://yuiga.dev/blog/en/ja/posts/swinir_image_restoration_using_swin_transformer/</link>
        <pubDate>Thu, 07 Jul 2022 01:17:49 +0900</pubDate>
        
        <atom:modified>Thu, 07 Jul 2022 01:17:49 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/swinir_image_restoration_using_swin_transformer/</guid>
        <description>残差接続が大量にあるの面白い 多分だけど, 真っ黒から真っ黒への変換みたいな無意味な変換によって重みの学習を引っ張られたくないので, クソデカ残差を入れているのだと思う (オキモチ) SwinTransformerのおかげでパラメタ数はかなり減っている</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/16e29d082ee3ac324f5c123c079340b8.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】LXMERT</title>
        <link>https://yuiga.dev/blog/en/ja/posts/lxmert/</link>
        <pubDate>Thu, 07 Jul 2022 00:45:57 +0900</pubDate>
        
        <atom:modified>Thu, 07 Jul 2022 00:45:57 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/lxmert/</guid>
        <description>ViLBERTとの大きな違いは, ROIのみを入力とする点</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/e891d708f76f1d792870b82dac339021.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>Impact Factor</title>
        <link>https://yuiga.dev/blog/en/ja/posts/impact_factor/</link>
        <pubDate>Wed, 06 Jul 2022 22:44:00 +0900</pubDate>
        
        <atom:modified>Wed, 06 Jul 2022 22:44:00 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/impact_factor/</guid>
        <description>学術雑誌の影響力を測る指標らしい (そんなのあるんだ) 今年の被引用数を過去2年分のPublicationで割る $\displaystyle {\text{IF}}_{y}={\frac {{\text{Citations}}_{y}}{{\text{Publications}}_{y-1}+{\text{Publications}}_{y-2}}}.$</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>post</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Do Transformer Modifications Transfer Across Implementations and Applications?</title>
        <link>https://yuiga.dev/blog/en/ja/posts/do_transformer_modifications_transfer_across_implementations_and_applications/</link>
        <pubDate>Mon, 27 Jun 2022 11:52:58 +0900</pubDate>
        
        <atom:modified>Mon, 27 Jun 2022 11:52:58 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/do_transformer_modifications_transfer_across_implementations_and_applications/</guid>
        <description>Transformerの改善案は大量にあるが, 本当に有効なのはどれだけあるの？という論文 結論 (有効な改善方法) 活性化関数: GLU+GeLU/Swish 正規化: RMS Norm パラメタ共有: デコーダの入出力における埋め込み表現を共有すると良い アーキテクチャ Mixture of Experts Transformer Synthesizer Product Key Memory</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】CP-GAN</title>
        <link>https://yuiga.dev/blog/en/ja/posts/cp-gan/</link>
        <pubDate>Mon, 27 Jun 2022 11:35:01 +0900</pubDate>
        
        <atom:modified>Mon, 27 Jun 2022 11:35:01 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/cp-gan/</guid>
        <description>todo</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】CLIP</title>
        <link>https://yuiga.dev/blog/en/ja/posts/clip/</link>
        <pubDate>Mon, 27 Jun 2022 11:15:34 +0900</pubDate>
        
        <atom:modified>Mon, 27 Jun 2022 11:15:34 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/clip/</guid>
        <description>CLIPによって, image↔textの特徴量変換が容易になったと言える → ViLD: Open-vocabulary Object Detection via Vision and Language Knowledge Distillation</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/e52bbfbca43e2b6586c2d680ebfd9635.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>機械学習</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】HAMT - History Aware Multimodal Transformer for Vision-and-Language Navigation</title>
        <link>https://yuiga.dev/blog/en/ja/posts/hamt_-_history_aware_multimodal_transformer_for_vision-and-language_navigation/</link>
        <pubDate>Sun, 26 Jun 2022 23:41:45 +0900</pubDate>
        
        <atom:modified>Sun, 26 Jun 2022 23:41:45 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/hamt_-_history_aware_multimodal_transformer_for_vision-and-language_navigation/</guid>
        <description>パラメタの更新にActor-Criticを使用 強化学習と模倣学習の両方を組み込んでいる</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/3ea79bf79276c5e527b93a786ea04e77.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】SOHO - Seeing Out of tHe bOx : End-to-End Pre-training for Vision-Language Representation Learning</title>
        <link>https://yuiga.dev/blog/en/ja/posts/soho_-_seeing_out_of_the_box__end-to-end_pre-training_for_vision-language_representation_learning/</link>
        <pubDate>Sun, 26 Jun 2022 21:51:51 +0900</pubDate>
        
        <atom:modified>Sun, 26 Jun 2022 21:51:51 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/soho_-_seeing_out_of_the_box__end-to-end_pre-training_for_vision-language_representation_learning/</guid>
        <description>クラスタリングの上位互換みたいなことをする パッチを特徴空間に飛ばす パッチに映る物体が同じ種類の物体なら, その特徴が同じクラスタidに含まれるように学習</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/0b8692c4c17fdd62eee928686237beb8.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】REVERIE - Remote Embodied Visual Referring Expression in Real Indoor Environments</title>
        <link>https://yuiga.dev/blog/en/ja/posts/reverie_-_remote_embodied_visual_referring_expression_in_real_indoor_environments/</link>
        <pubDate>Sun, 26 Jun 2022 17:18:43 +0900</pubDate>
        
        <atom:modified>Sun, 26 Jun 2022 17:18:43 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/reverie_-_remote_embodied_visual_referring_expression_in_real_indoor_environments/</guid>
        <description></description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/c81d7201d9aac75db20a0e2fd3b4d46b.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>multi-modal</category>
            
          
            
              <category>Vision-and-Language</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Maximum Classifier Discrepancy for Unsupervised Domain Adaptation</title>
        <link>https://yuiga.dev/blog/en/ja/posts/maximum_classifier_discrepancy_for_unsupervised_domain_adaptation/</link>
        <pubDate>Sun, 19 Jun 2022 01:43:11 +0900</pubDate>
        
        <atom:modified>Sun, 19 Jun 2022 01:43:11 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/maximum_classifier_discrepancy_for_unsupervised_domain_adaptation/</guid>
        <description>Domain Adaptation 従来手法 : sourceとtargetとで分布が違うはずなのに, ドメイン同士の境界(赤線)を基準に近づけようとしている → 分布の違いを考慮しつつ決定境界を修正する必要がある → GAN GAN風に学習する ２つのclassifierとそれらを生成するgenerator</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/f3dae8fd7dd7422bc584beb4614ab0a2.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Manifold Mixup: Better Representations by Interpolating Hidden States</title>
        <link>https://yuiga.dev/blog/en/ja/posts/manifold_mixup_better_representations_by_interpolating_hidden_states/</link>
        <pubDate>Wed, 15 Jun 2022 22:21:20 +0900</pubDate>
        
        <atom:modified>Wed, 15 Jun 2022 22:21:20 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/manifold_mixup_better_representations_by_interpolating_hidden_states/</guid>
        <description>どういうの？ 無作為に選んだ層までは普通に計算して，その層の出力の複数をランダムに選んでMixup そのままその値を使って最終層まで計算＆lossを計算し, 逆伝播 決定境界が滑らかになるらしい 簡単に説明すると, まず特徴量空間上で特徴量がflattenな状態に収束していくらしい flatten=小さい部分空間で表現できるというこ</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/36f01950b9eaae3b6a59568568d1b5a5.jpeg" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Un-Mix</title>
        <link>https://yuiga.dev/blog/en/ja/posts/un-mix/</link>
        <pubDate>Tue, 14 Jun 2022 22:30:40 +0900</pubDate>
        
        <atom:modified>Tue, 14 Jun 2022 22:30:40 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/un-mix/</guid>
        <description>$I_A$ にCutMixとMixup を掛ける ( Mixup: $I_{A}^{M}=\lambda I_{1}+(1-\lambda) I_{2}$) 画像の混合比率 $\lambda$ に応じて, 正例間の意味的距離を調節 $$\mathcal{L}_{final}!=!\mathcal{L}_{ori}+\underbrace{\lambda \mathcal{L}_{m}!(I_A^{M} (\downarrow), \hat I_A)}_{\text {normal order of mixtures}}!+!\underbrace{(1!-!\lambda) \mathcal{L}_{m}!(I_A^{M} (\uparrow), \hat I_A)}_{\text {reverse order of mixtures}} $$ Mix方法は, 単純にミニバッチを反転させて, indexごとにmixするだけ Mixup が効いて, より決定境界が明瞭に</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/d076b01f7540dca404730130e4db361f.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>自己教師あり学習</category>
            
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】SwAV</title>
        <link>https://yuiga.dev/blog/en/ja/posts/swav/</link>
        <pubDate>Mon, 13 Jun 2022 22:46:58 +0900</pubDate>
        
        <atom:modified>Mon, 13 Jun 2022 22:46:58 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/swav/</guid>
        <description>Unsupervised Learning of Visual Features by Contrasting Cluster Assignments Prototypical Contrastive Learning of Unsupervised Representations より複雑なことしてる Sinkhorn-Knoppアルゴリズムを用いてクラスの割当を最適化</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/66826199e2a620889f5064fc778716c4.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>自己教師あり学習</category>
            
          
            
              <category>クラスタリング</category>
            
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Sinkhorn Distances: Lightspeed Computation of Optimal Transport</title>
        <link>https://yuiga.dev/blog/en/ja/posts/sinkhorn_distances_lightspeed_computation_of_optimal_transport/</link>
        <pubDate>Mon, 13 Jun 2022 11:21:49 +0900</pubDate>
        
        <atom:modified>Mon, 13 Jun 2022 11:21:49 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/sinkhorn_distances_lightspeed_computation_of_optimal_transport/</guid>
        <description>Sinkhorn-Knoppアルゴリズムによって, 最適輸送距離を近似</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Supervised Contrastive Learning</title>
        <link>https://yuiga.dev/blog/en/ja/posts/supervised_contrastive_learning/</link>
        <pubDate>Sun, 12 Jun 2022 19:19:07 +0900</pubDate>
        
        <atom:modified>Sun, 12 Jun 2022 19:19:07 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/supervised_contrastive_learning/</guid>
        <description>Prototypical Contrastive Learning of Unsupervised Representations と同じ動機 本来類似度が高くても負例ペアは負例ペアとして認識してしまうので, よくないよね → ラベル情報を使いましょう → [* 教師あり対照学習] こうじゃなくて (一番下の犬がtarget) こうしたい</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/97e064e93b19391edf56f2f7b89d24bc.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>自己教師あり学習</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Multi-level Wavelet Convolutional Neural Networks</title>
        <link>https://yuiga.dev/blog/en/ja/posts/multi-level_wavelet_convolutional_neural_networks/</link>
        <pubDate>Thu, 09 Jun 2022 00:34:21 +0900</pubDate>
        
        <atom:modified>Thu, 09 Jun 2022 00:34:21 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/multi-level_wavelet_convolutional_neural_networks/</guid>
        <description></description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>ウェーブレット変換</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Transformer Interpretability Beyond Attention Visualization</title>
        <link>https://yuiga.dev/blog/en/ja/posts/transformer_interpretability_beyond_attention_visualization/</link>
        <pubDate>Wed, 08 Jun 2022 23:21:08 +0900</pubDate>
        
        <atom:modified>Wed, 08 Jun 2022 23:21:08 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/transformer_interpretability_beyond_attention_visualization/</guid>
        <description>LRPをTransformerにも使用できるようにしたもの LRPでは行列和や行列積に対応できない → いい感じに代替</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/7fa76a9565f479f15caff98a104b92e0.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>説明性</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】This Looks Like That: Deep Learning for Interpretable Image Recognition</title>
        <link>https://yuiga.dev/blog/en/ja/posts/this_looks_like_that_deep_learning_for_interpretable_image_recognition/</link>
        <pubDate>Wed, 08 Jun 2022 22:36:43 +0900</pubDate>
        
        <atom:modified>Wed, 08 Jun 2022 22:36:43 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/this_looks_like_that_deep_learning_for_interpretable_image_recognition/</guid>
        <description>割と学習が難しいらしい？ Clst: 潜在変数をパッチ単位で分割して, クラスタリング Sep: クラスタ同士を遠ざけるように学習</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/1ed3c42d9c84fb3f2502bde9a22861ea.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Affinity loss</title>
        <link>https://yuiga.dev/blog/en/ja/posts/affinity_loss/</link>
        <pubDate>Wed, 08 Jun 2022 19:51:47 +0900</pubDate>
        
        <atom:modified>Wed, 08 Jun 2022 19:51:47 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/affinity_loss/</guid>
        <description>ソフトマックスにクラスタリングの要素を持ち込んで、不均衡を是正するアルゴリズム. サポートベクターマシンのようなマージン最大化問題を考える</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>不均衡データ</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead</title>
        <link>https://yuiga.dev/blog/en/ja/posts/stop_explaining_black_box_machine_learning_models_for_high_stakes_decisions_and_use_interpretable_models_instead/</link>
        <pubDate>Tue, 07 Jun 2022 19:13:36 +0900</pubDate>
        
        <atom:modified>Tue, 07 Jun 2022 19:13:36 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/stop_explaining_black_box_machine_learning_models_for_high_stakes_decisions_and_use_interpretable_models_instead/</guid>
        <description>事後的な説明性は必ず近似を含むので, モデルの説明にはならない なので近似を含ませずに直接解釈可能なモデルを作らねばならない ステークホルダーは解釈可能性よりも, とりあえず「説明」がほしいということがよくある なので, 決定木ベースであったり, スコアリングベースの手法がビジネスで使われてしまう またステークホルダーは説明性を出力し</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>サーベイ論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Less complexity one-class classification approach using construction error of convolutional image transformation network</title>
        <link>https://yuiga.dev/blog/en/ja/posts/less_complexity_one-class_classification_approach_using_construction_error_of_convolutional_image_transformation_network/</link>
        <pubDate>Sun, 29 May 2022 02:29:38 +0900</pubDate>
        
        <atom:modified>Sun, 29 May 2022 02:29:38 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/less_complexity_one-class_classification_approach_using_construction_error_of_convolutional_image_transformation_network/</guid>
        <description>如何に異常検知を行うか？ 例えば, りんご以外を弾くようなモデルはどのように作れば良いのか 本論文では, AutoEncoder と同じ格好で, りんごだけをすべてLennaに変換するように学習する なので, りんごでない部分が入力された際は変な画像が生成されてしまうことになる</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/3e43cf9135c29287a9152a83fcab801d.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>異常検知</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】IA-RED2</title>
        <link>https://yuiga.dev/blog/en/ja/posts/ia-red2/</link>
        <pubDate>Sat, 28 May 2022 14:17:26 +0900</pubDate>
        
        <atom:modified>Sat, 28 May 2022 14:17:26 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/ia-red2/</guid>
        <description>AdaViTから引用されている パッチを途中でdropさせることができる めちゃくちゃ速い 強化学習っぽく学習</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>説明性</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】MixFormer</title>
        <link>https://yuiga.dev/blog/en/ja/posts/mixformer/</link>
        <pubDate>Sat, 28 May 2022 02:37:26 +0900</pubDate>
        
        <atom:modified>Sat, 28 May 2022 02:37:26 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/mixformer/</guid>
        <description>SwinTransformer の Local-window と, DwConv (PointWise・Depthwise) を並列に接続 なぜ？</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/09a2ea7f8a2639c8c6c1d53f1f4a5ac4.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】CycleMLP</title>
        <link>https://yuiga.dev/blog/en/ja/posts/cyclemlp/</link>
        <pubDate>Sat, 28 May 2022 01:47:06 +0900</pubDate>
        
        <atom:modified>Sat, 28 May 2022 01:47:06 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/cyclemlp/</guid>
        <description>従来のMLPモデルの問題点を克服 (Channel FC:性能が不十分、Spatial FC:計算量が多い) 任意の画像サイズに対応可能なCycle FCを提案 SwinTransformerよりも受容野が広いらしい</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/5d065635619c683412195575ee7d9ad9.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Pix2seq</title>
        <link>https://yuiga.dev/blog/en/ja/posts/pix2seq/</link>
        <pubDate>Mon, 23 May 2022 20:03:26 +0900</pubDate>
        
        <atom:modified>Mon, 23 May 2022 20:03:26 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/pix2seq/</guid>
        <description>入力 : 画像 出力 : $(y_{\text{min}},x_{\text{min}},y_{\text{max}},x_{\text{max}},c)$ 普通のMLMと同じ感じで, 学習. $$\text{maximize}\sum_{j=1}^{L}\bm{w}_{j}\log P(\tilde{\bm{y}}_{j}|{\bm{x}},{\bm {y}}_{1:j-1})~{},$$</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/0168559f2be4e44975551c3b759ece59.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>物体検出</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】ROAR</title>
        <link>https://yuiga.dev/blog/en/ja/posts/roar/</link>
        <pubDate>Fri, 20 May 2022 19:12:41 +0900</pubDate>
        
        <atom:modified>Fri, 20 May 2022 19:12:41 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/roar/</guid>
        <description>何らかの基準でマスクして, 説明指標を評価 マスクした画像がOODにならないように, マスクした画像を使って更に学習 マスク方法 → 比較対象は Random / Sobel 比較されている手法は grad / Guided Backprop / Integrated Gradients / SmoothGrad / SG-SQ / VarGrad 最も良い結果が得られたのはSG-SQとVarGrad</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/c3cea2d1579b431134b1d07c8325eaab.jpeg" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>説明性</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】FullGrad</title>
        <link>https://yuiga.dev/blog/en/ja/posts/fullgrad/</link>
        <pubDate>Wed, 18 May 2022 21:12:02 +0900</pubDate>
        
        <atom:modified>Wed, 18 May 2022 21:12:02 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/fullgrad/</guid>
        <description>Saliency Map は Weak dependenceとCompletenessを満たす必要がある Weak dependence Saliency Map $S(x)$ と入力 $x$ に弱い依存関係がある状態 ここでは, $x$ がどの集合に属しているかで $f(x)$ が定まる状態と定義 Completeness Saliency Map $S(x)$ と入力 $x$ から元のモデル $f(x)$が復元できる状態 例えば, バイアス $\boldsymbol{b}$を使わずに生成した $S(x)$では復元でき</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/3b79cffe26c989200d24186d1e8d9e11.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>説明性</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】RelTransformer</title>
        <link>https://yuiga.dev/blog/en/ja/posts/reltransformer/</link>
        <pubDate>Tue, 17 May 2022 18:47:10 +0900</pubDate>
        
        <atom:modified>Tue, 17 May 2022 18:47:10 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/reltransformer/</guid>
        <description>タスクはVRR (Visual Releationship Recognition) 既存手法はGNNなどが多いが, GNNは近傍しか見ておらず, 自分に近いところの関係しか見ていない 例: 野球 野球選手とバットだけを見るよりも, 周りのキャッチャーやピッチャーの情報もコンテキスト情報として有益 着目物体 $n_s $と物体 $n_o$ と, その関係 $r$ のtripletを入力して, encode encodeしたtripletから,</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/b29d1c29bdf5f31b35acff35828782fe.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>不均衡データ</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】TCFormer</title>
        <link>https://yuiga.dev/blog/en/ja/posts/tcformer/</link>
        <pubDate>Mon, 16 May 2022 13:55:34 +0900</pubDate>
        
        <atom:modified>Mon, 16 May 2022 13:55:34 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/tcformer/</guid>
        <description></description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/abaec9bfa8f3e64fcfdfa87eeddadd0d.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】SiT</title>
        <link>https://yuiga.dev/blog/en/ja/posts/sit/</link>
        <pubDate>Sun, 15 May 2022 21:10:22 +0900</pubDate>
        
        <atom:modified>Sun, 15 May 2022 21:10:22 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/sit/</guid>
        <description></description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>ViT</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Learning multiple visual domains with residual adapters</title>
        <link>https://yuiga.dev/blog/en/ja/posts/learning_multiple_visual_domains_with_residual_adapters/</link>
        <pubDate>Sun, 15 May 2022 15:29:44 +0900</pubDate>
        
        <atom:modified>Sun, 15 May 2022 15:29:44 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/learning_multiple_visual_domains_with_residual_adapters/</guid>
        <description>カーネルを選定するようなサブネットワークを作成する Adapter todo: できればもう一度読み返したい</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Adapt-and-Adjust: Overcoming the Long-Tail Problem of Multilingual Speech Recognition</title>
        <link>https://yuiga.dev/blog/en/ja/posts/adapt-and-adjust_overcoming_the_long-tail_problem_of_multilingual_speech_recognition/</link>
        <pubDate>Thu, 12 May 2022 17:41:56 +0900</pubDate>
        
        <atom:modified>Thu, 12 May 2022 17:41:56 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/adapt-and-adjust_overcoming_the_long-tail_problem_of_multilingual_speech_recognition/</guid>
        <description>Adapt-and-Adjust (A2), end-to-endの多言語音声認識モデル multilingual language modelをspeach-decoderとする Dual-Adaptersを採用 言語ごとに特徴抽出器を切り替えるイメージ これってほんとに言語ごとに切り替わってるの？ Adapterは Large-Scale Multilingual Speech Recognition with a Streaming End-to-End Modelが初出？ → と思ったら違った 初出: Learning multiple visual domains with residual adapters</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/8fe230f1c700e9c33d7c0269a34ea0dd.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>不均衡データ</category>
            
          
            
              <category>音声</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Two-phase training mitigates class imbalance for camera trap image classification with CNNs</title>
        <link>https://yuiga.dev/blog/en/ja/posts/two-phase_training_mitigates_class_imbalance_for_camera_trap_image_classification_with_cnns/</link>
        <pubDate>Thu, 12 May 2022 11:26:24 +0900</pubDate>
        
        <atom:modified>Thu, 12 May 2022 11:26:24 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/two-phase_training_mitigates_class_imbalance_for_camera_trap_image_classification_with_cnns/</guid>
        <description>Decoupling Representation and Classifier for Long-Tailed Recognition と真反対の手法 step1. balancedなデータセットで学習 step2. 特徴量抽出器の重みを固定して, 元のデータセットで線形分類器だけfine-tuning Class-specific F1-Scoreを用いて評価</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>不均衡データ</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Decoupling Representation and Classifier for Long-Tailed Recognition</title>
        <link>https://yuiga.dev/blog/en/ja/posts/decoupling_representation_and_classifier_for_long-tailed_recognition/</link>
        <pubDate>Thu, 12 May 2022 11:22:33 +0900</pubDate>
        
        <atom:modified>Thu, 12 May 2022 11:22:33 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/decoupling_representation_and_classifier_for_long-tailed_recognition/</guid>
        <description>クラス間の分布が違う=クラス間不均衡による影響についての論文 一般にモデルは「特徴量抽出器」と「クラス分類器」で構成されている クラス間の分布が違う場合, 「特徴量抽出器」と「クラス分類器」のどちらに悪影響か？ 答えは「クラス分類器」 特徴量の抽出においては, そこまで悪い影響はないらしい クラス分類器 : 写像された特徴空間において,</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/f7f204d7a0e9b222a4983dfdaa58bdc4.jpeg" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>機械学習</category>
            
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Rethinking the Value of Labels for Improving Class-Imbalanced Learning</title>
        <link>https://yuiga.dev/blog/en/ja/posts/rethinking_the_value_of_labels_for_improving_class-imbalanced_learning/</link>
        <pubDate>Tue, 10 May 2022 20:32:05 +0900</pubDate>
        
        <atom:modified>Tue, 10 May 2022 20:32:05 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/rethinking_the_value_of_labels_for_improving_class-imbalanced_learning/</guid>
        <description>不均衡データには正と負の両方の側面がある 正の側面 性能に寄与する → 負の側面 サンプル数が多いクラスに引っ張られて決定境界が歪む → https://arxiv.org/abs/2006.07529</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>todo</category>
            
          
            
              <category>自己教師あり学習</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】No Parameters Left Behind: Sensitivity Guided Adaptive Learning Rate for Training Large Transformer Models </title>
        <link>https://yuiga.dev/blog/en/ja/posts/no_parameters_left_behind_sensitivity_guided_adaptive_learning_rate_for_training_large_transformer_models/</link>
        <pubDate>Tue, 10 May 2022 14:16:57 +0900</pubDate>
        
        <atom:modified>Tue, 10 May 2022 14:16:57 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/no_parameters_left_behind_sensitivity_guided_adaptive_learning_rate_for_training_large_transformer_models/</guid>
        <description>https://arxiv.org/pdf/2202.02664.pdf</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>todo</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Should You Mask 15% in Masked Language Modeling?</title>
        <link>https://yuiga.dev/blog/en/ja/posts/should_you_mask_15_in_masked_language_modeling/</link>
        <pubDate>Tue, 10 May 2022 14:16:35 +0900</pubDate>
        
        <atom:modified>Tue, 10 May 2022 14:16:35 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/should_you_mask_15_in_masked_language_modeling/</guid>
        <description>https://arxiv.org/pdf/2202.08005.pdf</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>todo</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Masked Siamese Networks for Label-Efficient Learning</title>
        <link>https://yuiga.dev/blog/en/ja/posts/masked_siamese_networks_for_label-efficient_learning/</link>
        <pubDate>Tue, 10 May 2022 13:25:09 +0900</pubDate>
        
        <atom:modified>Tue, 10 May 2022 13:25:09 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/masked_siamese_networks_for_label-efficient_learning/</guid>
        <description>MAEっぽく, パッチをマスクしたものと元画像の間でSiamese Network https://www.slideshare.net/DeepLearningJP2016/dlmasked-siamese-networks-for-labelefficient-learning</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Self-Distillation Amplifies Regularization in Hilbert Space</title>
        <link>https://yuiga.dev/blog/en/ja/posts/self-distillation_amplifies_regularization_in_hilbert_space/</link>
        <pubDate>Tue, 10 May 2022 11:33:58 +0900</pubDate>
        
        <atom:modified>Tue, 10 May 2022 11:33:58 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/self-distillation_amplifies_regularization_in_hilbert_space/</guid>
        <description>Self-Distillation が如何に効いているかを理論的に解析 Mercer&amp;rsquo;s theorem https://arxiv.org/pdf/2002.05715.pdf</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Self-Supervised Learning for Semi-Supervised Time Series Classification</title>
        <link>https://yuiga.dev/blog/en/ja/posts/self-supervised_learning_for_semi-supervised_time_series_classification/</link>
        <pubDate>Tue, 10 May 2022 11:16:03 +0900</pubDate>
        
        <atom:modified>Tue, 10 May 2022 11:16:03 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/self-supervised_learning_for_semi-supervised_time_series_classification/</guid>
        <description>https://www.ismll.uni-hildesheim.de/pub/pdfs/pakdd_shayan.pdf</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
            
              <category>todo</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】ConvMAE</title>
        <link>https://yuiga.dev/blog/en/ja/posts/convmae/</link>
        <pubDate>Tue, 10 May 2022 11:04:57 +0900</pubDate>
        
        <atom:modified>Tue, 10 May 2022 11:04:57 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/convmae/</guid>
        <description>Convolutionを用いたViT におけるMAE を提案 https://arxiv.org/abs/2205.03892</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/b028e231b50d70e04739900de8dc4366.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Self-supervised Learning is More Robust to Dataset Imbalance</title>
        <link>https://yuiga.dev/blog/en/ja/posts/self-supervised_learning_is_more_robust_to_dataset_imbalance/</link>
        <pubDate>Tue, 10 May 2022 01:49:08 +0900</pubDate>
        
        <atom:modified>Tue, 10 May 2022 01:49:08 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/self-supervised_learning_is_more_robust_to_dataset_imbalance/</guid>
        <description>自己教師あり学習 → 不均衡データに対して強いロバスト性あり ラベルに囚われない表現も学習してくれるので, ロバスト性が強い 事前学習時はSAMを使うとよいらしい (SAM : Sharpness-Aware Minimization)</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】PVT</title>
        <link>https://yuiga.dev/blog/en/ja/posts/pvt/</link>
        <pubDate>Mon, 09 May 2022 22:04:23 +0900</pubDate>
        
        <atom:modified>Mon, 09 May 2022 22:04:23 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/pvt/</guid>
        <description>Pyramid Vision Transformer PVT v2では Positional Encodingが存在しない https://twitter.com/yu4u/status/1522360958228000769 FFNにzero padding付きのdepthwise convを入れることで位置情報をencodeさせて, Positional Encodingを置換 zero paddingに重要性がある → How Much Position Information Do Convolutional Neural Networks Encode?</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/0c01244dcdfb93a5f57a5e7f2d9e14aa.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】AdaViT</title>
        <link>https://yuiga.dev/blog/en/ja/posts/adavit/</link>
        <pubDate>Mon, 09 May 2022 21:51:34 +0900</pubDate>
        
        <atom:modified>Mon, 09 May 2022 21:51:34 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/adavit/</guid>
        <description>残差構造・selection構造を組み込んだViT Patch Selection : パッチを選定 Head Selection : ヘッドを選定 Block Selection : MHA・FFNを使うかどうか選定 https://arxiv.org/abs/2111.15668</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/6f514ea4f1a9c195b9bc2fb52a0a46e5.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Attention on Attention</title>
        <link>https://yuiga.dev/blog/en/ja/posts/attention_on_attention/</link>
        <pubDate>Mon, 09 May 2022 21:50:14 +0900</pubDate>
        
        <atom:modified>Mon, 09 May 2022 21:50:14 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/attention_on_attention/</guid>
        <description>https://arxiv.org/abs/1908.06954</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/156b181dd04c00d224a07fd76769b463.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】How Much Position Information Do Convolutional Neural Networks Encode?</title>
        <link>https://yuiga.dev/blog/en/ja/posts/how_much_position_information_do_convolutional_neural_networks_encode/</link>
        <pubDate>Fri, 06 May 2022 15:25:13 +0900</pubDate>
        
        <atom:modified>Fri, 06 May 2022 15:25:13 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/how_much_position_information_do_convolutional_neural_networks_encode/</guid>
        <description>仮説 : CNNは絶対的な位置情報を獲得している PoSENet : 位置情報のmapを予測するモデルを構築して仮説を検証 $f_{enc}$が位置情報がエンコードするなら, $f_{enc}$の中間層の出力から, 位置情報を復元できるはず f1よりもf5のほうが位置mapの精度が高い より深い層のほうがより強く位置情報を保持している 仮説「位置情報は</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/84c88d3f88677555febf87a52b8ced63.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】CMO</title>
        <link>https://yuiga.dev/blog/en/ja/posts/cmo/</link>
        <pubDate>Wed, 27 Apr 2022 23:49:33 +0900</pubDate>
        
        <atom:modified>Wed, 27 Apr 2022 23:49:33 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/cmo/</guid>
        <description>不均衡データ に有効なaugmentation手法であるCMOを提案 Influenced-Balanced Loss と同じ著者</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/252bf15ed4e7657dbbd5a873fb367ee3.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】cosFormer</title>
        <link>https://yuiga.dev/blog/en/ja/posts/cosformer/</link>
        <pubDate>Sun, 24 Apr 2022 01:54:44 +0900</pubDate>
        
        <atom:modified>Sun, 24 Apr 2022 01:54:44 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/cosformer/</guid>
        <description>ICLR 2022 普通のTransformer $$Attention(Q, K, V)_i = \frac{\sum_{j=1}^n\exp(q_i^Tk_j)\cdot v_j}{\sum_{j=1}^n\exp(q_i^Tk_j)}$$ expが括り出せれば, iとjとで分離できる → Linear Attention: Transformers are RNNs Attentionにおけるsoftmaxの重要な特性 Attention Matrix $A$が非負であること ReLUの場合を考えてみると, 負の値を0とすることで, 不要な値・誤った情報を掻き消すことができる 非線形な重み付け ReLUよりもsoftmaxのほ</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Double Descent</title>
        <link>https://yuiga.dev/blog/en/ja/posts/double_descent/</link>
        <pubDate>Fri, 15 Apr 2022 01:01:07 +0900</pubDate>
        
        <atom:modified>Fri, 15 Apr 2022 01:01:07 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/double_descent/</guid>
        <description>U字からlossが落ちていく減少 例えばシンプルな構造のニューラルネットワークと複雑なニューラルネットワークがあったとします。前者については従来から言われているように&amp;quot;under-fitting&amp;quot;と&amp;quot;over-fitting&amp;quot;からなるU字型の特性が観測できますが、後者は複雑にしてい</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/6b7f5b988ffe245d04a7656ae17afafc.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Deformable Conv</title>
        <link>https://yuiga.dev/blog/en/ja/posts/deformable_conv/</link>
        <pubDate>Thu, 14 Apr 2022 17:05:29 +0900</pubDate>
        
        <atom:modified>Thu, 14 Apr 2022 17:05:29 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/deformable_conv/</guid>
        <description>[**** https://gyazo.com/e4c2ed2a441c686afa02f2e0625b373f ] https://arxiv.org/abs/1703.06211</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Fine-tuning CNN Image Retrieval with No Human Annotation</title>
        <link>https://yuiga.dev/blog/en/ja/posts/fine-tuning_cnn_image_retrieval_with_no_human_annotation/</link>
        <pubDate>Mon, 11 Apr 2022 13:34:44 +0900</pubDate>
        
        <atom:modified>Mon, 11 Apr 2022 13:34:44 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/fine-tuning_cnn_image_retrieval_with_no_human_annotation/</guid>
        <description>todo https://arxiv.org/abs/1711.02512</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】CvT</title>
        <link>https://yuiga.dev/blog/en/ja/posts/cvt/</link>
        <pubDate>Mon, 11 Apr 2022 11:14:48 +0900</pubDate>
        
        <atom:modified>Mon, 11 Apr 2022 11:14:48 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/cvt/</guid>
        <description>Convは高いロバスト性を持つ 例えば画像のシフトに強かったり ⇒ ViTにConvを導入 Conv自体はパッチ分割 &amp;amp; 線形変換と同じ CvTはパッチ同士が重なり合う Positional Encodingは行わない Convが同じことをやってるらしい &amp;hellip; ? How Much Position Information Do Convolutional Neural Networks Encode?</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/6c4e175dee46ddc70c90103be6b3463f.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】SmeLU</title>
        <link>https://yuiga.dev/blog/en/ja/posts/smelu/</link>
        <pubDate>Thu, 07 Apr 2022 00:32:10 +0900</pubDate>
        
        <atom:modified>Thu, 07 Apr 2022 00:32:10 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/smelu/</guid>
        <description>ReLUの原点での急な変化を, 2次関数で補完することでスムーズにした活性化関数 SmeLU (Smooth ReLU)を提案 リコメンデーションシステムにおいては, 再現性の低さは致命的となる ReLU は勾配がジャンプするので(sudden jump), 損失平面に局所領域ができてしまう そのため, 遷移領域が狭まる 遷移領域が狭まってしまうと局所的な遷移しかしないので, モデ</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/f6d2d89f1dab00c078e306644d9b6c36.jpeg" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】ConvNext</title>
        <link>https://yuiga.dev/blog/en/ja/posts/convnext/</link>
        <pubDate>Wed, 30 Mar 2022 16:11:00 +0900</pubDate>
        
        <atom:modified>Wed, 30 Mar 2022 16:11:00 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/convnext/</guid>
        <description>ResNetを現代風に DepthWiseにしたり (PointWise・Depthwise) カーネルサイズ変えたり bottleneck内のレイヤーの順番を変えたり BNからLNにしたり 地味に実装でtimmつかてますねん https://github.com/facebookresearch/ConvNeXt/blob/d1fa8f6fef0a165b27399986cc2bdacc92777e40/models/convnext.py</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/986e317ff06a7c695bfdde8657238e6e.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】DeepNet</title>
        <link>https://yuiga.dev/blog/en/ja/posts/deepnet/</link>
        <pubDate>Wed, 30 Mar 2022 13:00:12 +0900</pubDate>
        
        <atom:modified>Wed, 30 Mar 2022 13:00:12 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/deepnet/</guid>
        <description>モデル更新量を見る モデル更新後, 出力がどの程度変化したか 具体的には、まず、18レイヤーの通常の Post-LN トランスフォーマーを訓練させた場合、訓練が不安定であり、検証セットの損失関数の値（ロス）が収束しないことを示しています。このとき、「モデル更新量 (model update)」、すなわち、初期化時に比べて、モデルの更新後に、出力の値がどの</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        <media:content url="https://yuiga.dev/bloghttps://gyazo.com/e954521487cd3a816ac55a0a15960a20.png" medium="image"><media:title type="html">featured image</media:title></media:content>
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Attention Bottlenecks for Multimodal Fusion</title>
        <link>https://yuiga.dev/blog/en/ja/posts/attention_bottlenecks_for_multimodal_fusion/</link>
        <pubDate>Wed, 30 Mar 2022 13:00:03 +0900</pubDate>
        
        <atom:modified>Wed, 30 Mar 2022 13:00:03 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/attention_bottlenecks_for_multimodal_fusion/</guid>
        <description>https://arxiv.org/abs/2107.00135</description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      
      <item>
        <title>【論文メモ】Don&#39;t Decay the Learning Rate, Increase the Batch Size</title>
        <link>https://yuiga.dev/blog/en/ja/posts/dont_decay_the_learning_rate_increase_the_batch_size/</link>
        <pubDate>Wed, 30 Mar 2022 12:59:52 +0900</pubDate>
        
        <atom:modified>Wed, 30 Mar 2022 12:59:52 +0900</atom:modified>
        <guid>https://yuiga.dev/blog/en/ja/posts/dont_decay_the_learning_rate_increase_the_batch_size/</guid>
        <description></description>
        
        <dc:creator>YuWd (Yuiga Wada)</dc:creator>
        
        
        
        
          
            
              <category>論文</category>
            
          
        
        
        
          
            
          
        
      </item>
      

    
  </channel>
</rss>
