Περιγραφή¶
The program structure implements a model-based clustering method for inferring population structure using genotype data consisting of unlinked markers.
STRUCTURE 2.3.4¶
Συμβουλευτείτε τη διαδικασία μεταφοράς αρχείων στη συστοιχία προκειμένου να ανεβάσετε τα δεδομένα σας στο φάκελο εργασίας.
Χρήση από command line¶
Για λίγες προσομοιώσεις, μπορούμε να εκτελέσουμε το STRUCTURE τοπικά σύμφωνα με τις οδηγίες της τεκμηρίωσης. Για να το φορτώσουμε, εκτελούμε την εντολή module load structure
, και ύστερα μπορούμε να το εκτελέσουμε με την εντολή structure
. Προκειμένου όμως να εκτελέσουμε ένα μεγάλο σύνολο προσομοιώσεων, θα πρέπει να υποβάλουμε εργασία στο slurm
σύμφωνα με τις οδηγίες. Πιο συγκεκριμένα, θα πρέπει να τρέξουμε μια παραμετρική προσομοίωση.
Η υποβολή της εργασίας γίνεται με την εντολή sbatch <filename.sh>
, όπου το αρχείο υποβολής filename.sh
θα πρέπει να βρίσκεται στον ίδιο φάκελο με τα αρχεία του project μας και να έχει μορφή όπως τα ακόλουθα παραδείγματα.
Παράδειγμα παραμετροποίησης μέσω γραμμής εντολών:
SLURM submission script 1
#!/bin/bash
#SBATCH --partition=batch
#SBATCH -a 100-1000:100
# Jobs will have SLURM_ARRAY_TASK_ID = 100, 200, 300, ..., 1000
# We're going to set "number of individuals" to the above values
module load structure
# Our varying parameter is NUMINDS (set by -N flag)
structure -N $SLURM_ARRAY_TASK_ID
Παράδειγμα παραμετροποίησης από αρχείο:
SLURM submission script 2
#!/bin/bash
#SBATCH --partition=batch
#SBATCH -a 0-5
# Jobs will have SLURM_ARRAY_TASK_ID from 0 to 5
# One job for each of our 6 parameter files
module load structure
# Suppose parameter files are in ~/my_folder_with_parameter_files
# Suppose we only want to change mainparams
# Put filenames in variable
param_files=$(ls ~/my_folder_with_parameter_files/)
# Turn it into an array
param_file_array=($param_files)
# Each parameter set is matched to a SLURM_ARRAY_TASK_ID
structure -m ~/my_folder_with_parameter_files/${param_file_array[$SLURM_ARRAY_TASK_ID]} -e ~/my_folder_with_parameter_files/extraparams
Παρακολουθούμε με την εντολή squeue
την εξέλιξη της εργασίας.
Eφόσον η εργασία έχει εκκινήσει μπορούμε να ελέγχουμε την πρόοδο της επίλυσης μέσω των αρχείων εξόδου. Π.χ.:
# tail -f *.out
# cat *log
Χρήση από GUI¶
Για να χρησιμοποιήσουμε το γραφικό περιβάλλον, ανοίγουμε με έναν browser την σελίδα https://hpc.auth.gr και ξεκινάμε απομακρυσμένη επιφάνεια εργασίας στην συστοιχία σύμφωνα με τις οδηγίες. Ανοίγουμε το γραφικό περιβάλλον πηγαίνοντας στα Applications -> Bioinformatics -> STRUCTURE
και φτιάχνουμε το project μας σύμφωνα με τις οδηγίες της τεκμηρίωσης.
Για να τρέξουμε λίγες προσομοιώσεις, μπορούμε να χρησιμοποιήσουμε το γραφικό περιβάλλον (Project -> Start a job
), αλλά όταν είναι πολλές συνίσταται αντ'αυτού να εκμεταλλευτούμε τους πόρους της συστοιχίας χρησιμοποιώντας το Terminal (βλέπε προηγούμενη ενότητα).