post
特徴量エンジニアリング
· ☕ 1 min read
featuretools では Deep Feature Synthesis と呼ばれる方法で新たな特徴を生成しています。DFSでは primitive と呼ばれる関数を使ってデータの集約と変換を行います。primitive の例としては、列の平均や最大値を取る関数を挙げることができます。また自分で定義した関数を primitive として使うこともできます。 参考: https://qiita.com/Hironsan/ite ...

logmel
· ☕ 1 min read
ログメルスペクトログラム(Log-melspectrogram) → 振幅スペクトルをメル尺度(実際の音と人間の音高知覚の差異を吸収したもの)で扱うためにメルフィルターバンクを適応たものです。 参考: https://www.acceluniverse.com/blog/developers/2019/11/-cd-mir-mirmusic-information-retrieval-ismirmir201920.html ...

メル尺度
· ☕ 1 min read
心理学者のStanley Smith Stevensらによって提案された、人間の音高知覚が考慮された尺度です。 1000Hzの純音の高さの感覚を1000メルと決めた上で、1000メルの半分の高さに感じた音を500メル、1000メルの2倍の高さに感じた音を2000メルという容量で定めたものです。 Deep Learning for Audio Signal Processing → Deep Learningにおいて ...


振幅スペクトル
· ☕ 1 min read
横軸: 周波数 縦軸: Fの絶対値の2乗(=パワー) → 「パワースペクトル」と言う. 横軸: 周波数 縦軸: Fの振幅の絶対値 → 「振幅スペクトル」と言う. 参考: http://www.isc.meiji.ac.jp/~mcelab/www_jyo_en2/jyo_en_2_7_j_2015_f/index_sj.html#:~:text ...

環境音の認識
· ☕ 1 min read
#機械学習 ディープラーニングによる環境音の認識 → https://qiita.com/shinmura0/items/6befb83f7cde7b091905#精度向上の歴史 → 音の前処理は通常logmelを用います → logmelで処理することにより、音の生波形を 周波数と時間方向で表現でき、音を画像として扱うことができます ...

GRU (ゲート付き回帰ユニット)
· ☕ 1 min read
#機械学習 **ゲート付き回帰ユニット(GRU) は、LSTMの変化形のネットワークになります。LSTMよりもゲートが1つ少なく、配線が少し異なります。**入力ゲート、出力ゲート、忘却ゲートの代わりに更新ゲートがあります。更新ゲートは最後の状態からどれだけの情報を保持し、前の層からどれだけの情報を取り込むかを決定します。リ ...

HARKingについて
· ☕ 1 min read
https://twitter.com/tmaehara/status/1474241494282350615 https://twitter.com/ykamit/status/1077716200845500416 https://ja.wikipedia.org/wiki/HARKing ...

bcrypt
· ☕ 0 min read
...