Μετάβαση στο περιεχόμενο

Περιγραφή

VCFtools is a program package designed for working with VCF files, such as those generated by the 1000 Genomes Project. The aim of VCFtools is to provide easily accessible methods for working with complex genetic variation data in the form of VCF files.

This toolset can be used to perform the following operations on VCF files:

  • Filter out specific variants
  • Compare files
  • Summarize variants
  • Convert to different file types
  • Validate and merge files
  • Create intersections and subsets of variants

VCFtools consists of two parts, a perl module and a binary executable. The perl module is a general Perl API for manipulating VCF files, whereas the binary executable provides general analysis routines.

Home Page Releases Page

VCFtools 0.1.16

Documentation pages

Παράδειγμα χρήσης

Έστω ότι το αρχείο εισόδου λέγεται my_data.vcf (εναλλακτικά μπορείτε να δοκιμάσετε κάποιο από τα παραδείγματα στο φάκελο /mnt/apps/prebuilt/vcftools/v0.1.16/examples). Το script υποβολής της εργασίας θα έχει την ακόλουθη μορφή:

SLURM submission script
#!/bin/bash
#SBATCH --job-name=vcftools-0.1.16-case
#SBATCH --partition=batch
#SBATCH --time=1:00:00
#SBATCH --nodes=1

# Example 1: run as executable

module load vcftools

vcftools --vcf my_data.vcf

# Example 2: run as PERL module

module load gcc/10.2.0 perl/5.36.0

vcf-stats my_data.vcf

Στο $HOME μας στο login node, δημιουργούμε ένα νέο φάκελο όπου τοποθετούμε τα αρχεία εισόδου και το script υποβολής της εργασίας, έστω vcftools-0.1.16-case.sh.

# mkdir vcftools-0.1.16-case
# cd vcftools-0.1.16-case

Η υποβολή της εργασίας γίνεται με την εντολή sbatch vcftools-0.1.16-case.sh ως εξής:

# sbatch vcftools-0.1.16-case.sh

Παρακολουθούμε με την εντολή squeue την εξέλιξη της εργασίας.

Eφόσον η εργασία έχει εκκινήσει μπορούμε να ελέγχουμε την πρόοδο της επίλυσης μέσω των αρχείων εξόδου. Π.χ.:

# tail -f *.out