- 
モデルは「ViT-(1)/(2)」という名前で表され(1)にはモデルサイズB/L/Hが入ります。(2)にはパッチの大きさの16や14などが入ります。ViT-L/16であればViT-Largeで入力画像のパッチの1つの大きさが16であるモデルのことです。 
 https://qiita.com/omiita/items/0049ade809c4817670d7
JavaScriptを有効にしてください
    
    ViT
  
  
   ·   ☕ 1 min read 
  
  
    
  
     
      
    
  モデルは「ViT-(1)/(2)」という名前で表され(1)にはモデルサイズB/L/Hが入ります。(2)にはパッチの大きさの16や14などが入ります。ViT-L/16であればViT-Largeで入力画像のパッチの1つの大きさが16であるモデルのことです。
https://qiita.com/omiita/items/0049ade809c4817670d7
