k8s – 行李の底に収めたり[YuWd]

【k8s・DDP】クラスタ上でのtorch.loadが遅い

📅 2023/9/17 · ☕ 3 min read

概要巨大なembeddingをチャンクで外部に保存し，DDP(Distributed Data Parallel)を使った学習時に各GPUで読み込みたいそんなときtorch.load(path, map_location=f"cuda:{rank}")にかかる時間の分散が大きい場合がある前提: torch.loa ...

#k8s
#PyTorch
#post