Περιγραφή¶
VCFtools is a program package designed for working with VCF files, such as those generated by the 1000 Genomes Project. The aim of VCFtools is to provide easily accessible methods for working with complex genetic variation data in the form of VCF files.
This toolset can be used to perform the following operations on VCF files:
- Filter out specific variants
- Compare files
- Summarize variants
- Convert to different file types
- Validate and merge files
- Create intersections and subsets of variants
VCFtools consists of two parts, a perl module and a binary executable. The perl module is a general Perl API for manipulating VCF files, whereas the binary executable provides general analysis routines.
VCFtools 0.1.16¶
Documentation pages¶
- Binary executable manual v0.1.16 and binary executable usage examples
- PERL module documentation and usage examples for the PERL API
Παράδειγμα χρήσης¶
Έστω ότι το αρχείο εισόδου λέγεται my_data.vcf
(εναλλακτικά μπορείτε να δοκιμάσετε κάποιο από τα παραδείγματα στο φάκελο /mnt/apps/prebuilt/vcftools/v0.1.16/examples
). Το script υποβολής της εργασίας θα έχει την ακόλουθη μορφή:
SLURM submission script
#!/bin/bash
#SBATCH --job-name=vcftools-0.1.16-case
#SBATCH --partition=batch
#SBATCH --time=1:00:00
#SBATCH --nodes=1
# Example 1: run as executable
module load vcftools
vcftools --vcf my_data.vcf
# Example 2: run as PERL module
module load gcc/10.2.0 perl/5.36.0
vcf-stats my_data.vcf
Στο $HOME
μας στο login node, δημιουργούμε ένα νέο φάκελο όπου τοποθετούμε τα αρχεία εισόδου και το script υποβολής της εργασίας, έστω vcftools-0.1.16-case.sh
.
# mkdir vcftools-0.1.16-case
# cd vcftools-0.1.16-case
Η υποβολή της εργασίας γίνεται με την εντολή sbatch vcftools-0.1.16-case.sh
ως εξής:
# sbatch vcftools-0.1.16-case.sh
Παρακολουθούμε με την εντολή squeue
την εξέλιξη της εργασίας.
Eφόσον η εργασία έχει εκκινήσει μπορούμε να ελέγχουμε την πρόοδο της επίλυσης μέσω των αρχείων εξόδου. Π.χ.:
# tail -f *.out