Μετάβαση στο περιεχόμενο

Pytorch

Η Pytorch είναι ένα framework μηχανικής μάθησης βασισμένο στη βιβλιοθήκη Torch

Pytorch 2.1.0 + GPU support (Ampere partition)

Δημιουργία PyTorch Virtual Enviroment

Προκειμένου να χρησιμοποιήσουμε την PyTorch με χρήση GPU πρέπει πρώτα να στήσουμε ένα περιβάλον python. Αφότου συνδεθείτε στο cluster μπορείτε να τρέξετε τις παρακάτω εντολές:

# module load gcc/12.2.0 python/3.10.10
# python3 -m venv pytorch-2.1.0
# source pytorch-2.1.0/bin/activate
# pip install --upgrade pip
# pip install torch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 --index-url https://download.pytorch.org/whl/cu118

Η εγκατάσταση του PyTorch συνήθως ολοκληρώνεται μέσα σε 5 λεπτά. Έπειτα μπορείτε να επαληθεύσετε την σωστή δημιουργία του περιβάλλοντος υποβάλλοντας το παρακάτω python script (pytorch_test.py) στο ampere partition:

PyTorch Test
import torch
import sys
print(torch.cuda.is_available())
print(torch.cuda.device_count())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(0))
sys.exit()

Job Submission

Θα υποβάλουμε το παραπάνω δοκιμαστικό Python script στο Ampere partition με το bash script pytorch-2.1.0-case.sh:

SLURM submission script
#!/bin/bash
#SBATCH --job-name=pytorch-2.1.0-case
#SBATCH --partition=ampere
#SBATCH --gres=gpu:1
#SBATCH --ntasks=1
#SBATCH --time=10:00

source ~/pytorch-2.1.0/bin/activate
# Where ~/pytorch-2.1.0/ is the path to the virtual environment
python3 pytorch_test.py

Αν όλα έχουν γίνει πάει καλά θα πρέπει το *.out αρχείο να περιέχει τις εξείς γραμμές:

Output

1  True
2  1 
3  0
4  NVIDIA A100-SXM4-40GB