CV
【論文メモ】Can Neural Nets Learn the Same Model Twice? Investigating Reproducibility and Double Descent from the Decision Boundary Perspective
· ☕ 4 min read
はじめに CVPR22 決定境界を描画し, 再現性と汎化性について定量的に考察した論文 決定境界の描画 (領域の決定) 如何に決定境界を描画するかが重要になってくる その上でまず, データ多様体 $\mathcal{M}$の近傍(on-manifold)を取るのか, $\mathcal{M}$から離れた領域(off-manifold)を取るのかを考 ...


Vuforia: ARマーカーは非対称な配置が精度を上げる
· ☕ 1 min read
Vuforiaのマーカー検出精度はゴミ 出来るだけARマーカーの検出精度を上げたい Vuforiaは何を見てマーカーを判断しているのか? コーナー検出っぽいのやって特徴量を抽出してる模様 https://library.vuforia.com/objects/best-practices-designing-and-developing-image-based-targets なるだけ特徴量をまばらに(=対称性を持たせない様式で)配置すると良いようだ 下の図はopencvでもvuforiaでも簡単に使えるARマーカ ...


PCA Color Augmentation (PCACA)
· ☕ 1 min read
AlexNetで使われたらしいData augumentation手法 そんなに使われてるイメージはない. 古代の手法?? Fancy PCA / PCACAとも言うらしい?(要出典) 画像中の色の分布を考慮したデータ拡張ができる 例えば, 明るいところは明るく, 暗いところは暗く調節できる 流れは簡単 $C\times H\times W$をflattenして, $C\times HW$にする 各チャネ ...

Perspective-n-Point問題
· ☕ 1 min read
世界座標系における3D点群と, それらに対応する2D画像が与えられた場合において, カメラのポーズ推定を行う問題 カメラのポーズは平行移動と回転の6DOFで, Perspective-n-Point問題はPnPと略されることが多い P3Pは最低三点あれば解ける 一般化されたPnPを解くアルゴリズムは様々ある EPnP SQPnP: A Consistently Fast and Globally Optimal Solution to the Perspective-n-Point ...

Canny法
· ☕ 1 min read
かなり古い(1986年)エッジ検出手法 授業で使ってるチームがいたので気になって調べてみた 流れ ノイズをへらすため, ガウシアンフィルタ ソーベルフィルタを用いて画素値を微分し, 勾配と法線ベクトルを求める →ついでにこれで輪郭を抽出したことになる 抽出した輪郭線を細くしていく → ある画素 $x$に注目したとき, 法線方向に隣接する2点を ...


【論文メモ】NeRF
· ☕ 1 min read
Positional Encoding 低周波成分である $(x,y,z,\theta,\phi)$から高周波成分である $(R,G,B,D)$を復元するため, 以下に示すPositional Encodingを通したあとにMLPに入力 $$\gamma(t) = (\sin(2^0t\pi), \cos(2^0t\pi), \cdots, \sin(2^Lt\pi), \cos(2^Lt\pi))$$ この機構をNTKによって実験した論文→ Fourier Features Let Networks Learn High Frequency Functions in Low Dimensional Domains このPositional Encodingはフーリエ特 ...


epipolar
· ☕ 1 min read
「カメラ $O_L$から見て $X_L$に物体が写っている」とき、「カメラ $O_R$ から見てどこに物体が写るか」の候補 https://qiita.com/Thought_Nibbler/items/9cb7c2637000eecc1a30 “平行な目"では, epipolar lineは平行になる https://gyazo.com/0357ac0708ea93a2036c5c88a388a321[https://gyazo.com/73088515f6591c4dc94313d88accc163] ...


ランバート反射
· ☕ 1 min read
引用: https://t.ly/4XHt 法線ベクトルがあれば, 表面が再構成可能 一つの平面に対して, 法線ベクトルをつなげていけば良い ...


FLANN
· ☕ 1 min read
高速に最近傍探索できるらしい OpenCVにも組み込まれてるっぽい SIFT + FLANN → https://docs.opencv.org/4.x/da/de9/tutorial_py_epipolar_geometry.html ...

Mask RCNN
· ☕ 1 min read
roi をencodeしたものをfeature map に投影する際, shapeが合わないので工夫する必要がある → ROI pooling と ROI Align (Mask RCNNはコッチ) mask-branchでmaskを生成 各画素ごとにクラス確率を計算 ROI pooling ROI Align bilinear補完を行う ...