Busco¶
BUSCO (Benchmarking Universal Single-Copy Orthologs) provides measures for quantitative assessment of genome assembly, gene set, and transcriptome completeness based on evolutionarily informed expectations of gene content from near-universal single-copy orthologs.
Busco 5.8.0¶
Παράδειγμα χρήσης¶
Φτιάχνουμε ένα φάκελο όπου θα τοποθετήσουμε τα αρχεία εισόδου. Στον φακελο αυτόν πρέπει να υπάρχει το input fasta αρχείο, το submission script και, προαιρετικά, το busco configuration αρχείο (.ini).
$ mkdir busco-5.8.0-case
$ cd busco-5.8.0-case
Το script υποβολής της εργασίας θα έχει την ακόλουθη μορφή:
Busco submission script
#!/bin/bash
#SBATCH --job-name=busco-5.8.0-case
#SBATCH --partition=batch
#SBATCH --nodes=1
#SBATCH --ntasks=8
#SBATCH --time=10:00
module load gcc/13.2.0-iqpfkya openmpi/5.0.3-rhzbeym busco/5.8.0
busco -i <input.fasta> -o <output> -m <mode> -c $SLURM_NTASKS --auto-lineage
# The following command will run BUSCO on the input.fasta file using the specified lineage and mode, with the number of tasks specified by the SLURM_NTASKS environment variable.
# The output will be written to the specified output directory as specified by the -o option.
# Available lineages can be found by running 'busco --list-datasets'.
# Busco can also automatically select the lineage based on the input file if the '-l' option is omitted and the --auto-lineage command line argument is used.
# Be aware that the auto-lineage option may not always select the correct lineage and will download all available lineages to check for the best match.
# Available modes are 'genome', 'transcriptome', 'proteins'.
Αποθηκεύουμε τα περιεχόμενα σε ένα νέο αρχείο (έστω busco-5.8.0-case.sh
) και το υποβάλλουμε προς εκτέλεση με την εντολή sbatch
ως εξής:
Job submission
$ sbatch busco-5.8.0-case.sh
Παρακολουθούμε με την εντολή squeue
την εξέλιξη της εργασίας.
Εφόσον η εργασία έχει εκκινήσει μπορούμε να ελέγχουμε την πρόοδο της επίλυσης μέσω των αρχείων εξόδου. Π.χ.:
Tail output
$ tail -f *.out