High Performance Computing
Εκπαιδευτικός Οδηγός
Τί είναι το HPC;
Ο όρος HPC (High Performance Computing) αναφέρεται σε υποδομές
οι οποίες είναι συστοιχίες υπολογιστών (clusters) που συνδυάζουν εκατοντάδες
ή χιλιάδες επεξεργαστικές μονάδες (CPU/GPU) και μεγάλα μεγέθη μνήμης RAM,
για να λύσουν υπολογιστικά προβλήματα που δεν μπορεί να αντιμετωπίσει ένας
μεμονωμένος υπολογιστής.
Εισαγωγή
Πώς λειτουργεί
Αιτήσεις
Βασικές έννοιες
Κόμβος (Node)
Μονάδα επεξεργασίας της συστοιχίας
Κάθε κόμβος λειτουργεί ως αυτόνομη υπολογιστική μονάδα με δικούς του πόρους.
Χιλιάδες τέτοιοι κόμβοι διασυνδέονται μέσω δικτύου υψηλής ταχύτητας,
επιτρέποντας παράλληλους υπολογισμούς μεγάλης κλίμακας.
Scheduler (Slurm)
Σύστημα διαχείρισης και κατανομής πόρων
Το Slurm δέχεται αιτήματα εργασιών (jobs), αποφασίζει πότε και πού θα
εκτελεστούν, και εξασφαλίζει τη δίκαιη κατανομή πόρων μεταξύ όλων των χρηστών.
Shared File System
Ενιαίος αποθηκευτικός χώρος
Ένα κατανεμημένο σύστημα αρχείων εξασφαλίζει ότι τα δεδομένα σας είναι
προσβάσιμα από οποιονδήποτε κόμβο χωρίς να χρειάζεται να τα μεταφέρετε
ή να τα αντιγράφετε.
Σύστημα Modules
Διαχείριση λογισμικού μέσω module load
Το Lmod είναι ιεραρχικό σύστημα διαχείρισης εγκαταστάσεων λογισμικού
και εξαρτήσεων. Επιτρέπει εύκολη δυναμική φόρτωση εφαρμογών και βιβλιοθηκών.
Γιατί να χρησιμοποιήσω την υποδομή HPC;
Η Υπερυπολογιστική Συστοιχία Αριστοτέλης είναι σχεδιασμένη για απαιτητικά
workflows. Είτε ασχολείστε με την εκπαίδευση σύνθετων μοντέλων Deep Learning,
είτε με πολλαπλές ταυτόχρονες προσομοιώσεις, οι υποδομές μας προσφέρουν
την ισχύ και τη μνήμη που χρειάζεστε.