ESC50 📅 2022/1/11 · ☕ 1 min read ESC-50は環境音を50クラス、2,000ファイル集めたデータセットです。 50クラスの環境音40ファイル/クラスで集めたもの(1ファイル5秒)で、400ファイルが1 foldという単位でグループ分けされている。readmeにも書いてあるが本来は以下のような形でcross validationを行って分類精度を出すべき 引用 ... #post
Data augumentation 📅 2022/1/10 · ☕ 1 min read Mixup SpecAugment https://qiita.com/koshian2/items/d0661842eb66a7c0c0f3 ... #post
nouveau 📅 2022/1/8 · ☕ 1 min read 現在はNVIDIAのプロプライエタリなLinux用ドライバをリバースエンジニアリングして、 NVIDIAのビデオカード用のフリーなドライバを開発することを狙いとしている。 引用’ https://ja.wikipedia.org/wiki/Nouveau デフォルトでインストールされているのはnouveauという別のドライバなので, 普通はnvidia-drivers を入れ直す ... #post
SQLだけで推薦システム 📅 2022/1/7 · ☕ 1 min read https://nnahito.com/articles/4 SQLのみで協調フィルダリング → https://qiita.com/yaiwase/items/96ec53f513863621d528 ... #post
Deep Feature Synthesis 📅 2022/1/2 · ☕ 1 min read 複数のDataFrameが与えられたとき、aggregateしたり統計量を算出したり特徴量間の四則演算をやって特徴量を作成しますが、これらの作業をいい塩梅にやってくれるのがDeep Feature Synthesisであり、これをやってくれる関数がfeaturetools.dfs()です。 参考: https://qiita.com/studio_haneya/items/6b5204899ea61366d494 ... #post
特徴量エンジニアリング 📅 2022/1/2 · ☕ 1 min read featuretools では Deep Feature Synthesis と呼ばれる方法で新たな特徴を生成しています。DFSでは primitive と呼ばれる関数を使ってデータの集約と変換を行います。primitive の例としては、列の平均や最大値を取る関数を挙げることができます。また自分で定義した関数を primitive として使うこともできます。 参考: https://qiita.com/Hironsan/ite ... #post
logmel 📅 2022/1/1 · ☕ 1 min read ログメルスペクトログラム(Log-melspectrogram) → 振幅スペクトルをメル尺度(実際の音と人間の音高知覚の差異を吸収したもの)で扱うためにメルフィルターバンクを適応たものです。 参考: https://www.acceluniverse.com/blog/developers/2019/11/-cd-mir-mirmusic-information-retrieval-ismirmir201920.html ... #post
メル尺度 📅 2021/12/31 · ☕ 1 min read 心理学者のStanley Smith Stevensらによって提案された、人間の音高知覚が考慮された尺度です。 1000Hzの純音の高さの感覚を1000メルと決めた上で、1000メルの半分の高さに感じた音を500メル、1000メルの2倍の高さに感じた音を2000メルという容量で定めたものです。 Deep Learning for Audio Signal Processing → Deep Learningにおいて ... #post
振幅スペクトル 📅 2021/12/31 · ☕ 1 min read 横軸: 周波数 縦軸: Fの絶対値の2乗(=パワー) → 「パワースペクトル」と言う. 横軸: 周波数 縦軸: Fの振幅の絶対値 → 「振幅スペクトル」と言う. 参考: http://www.isc.meiji.ac.jp/~mcelab/www_jyo_en2/jyo_en_2_7_j_2015_f/index_sj.html#:~:text ... #post