JavaScriptを有効にしてください

環境音の認識

 ·  ☕ 1 min read

#機械学習

ディープラーニングによる環境音の認識
https://qiita.com/shinmura0/items/6befb83f7cde7b091905#精度向上の歴史
→ 音の前処理は通常logmelを用います
→ logmelで処理することにより、音の生波形を
周波数と時間方向で表現でき、音を画像として扱うことができます。

  • logmel-CNN
    • log-mel→画像処理できる→CNN
  • EnvNet
    • logmelで処理するのではなく, 直接波形を見る

VGGish
学習済みモデル

共有

YuWd (Yuiga Wada)
著者
YuWd (Yuiga Wada)
機械学習・競プロ・iOS・Web