FONTOSABB PIPELINE-ok

Exome-cap pipeline: A pipeline segítségével a nyers fastq fájlok minőségellenőrzése (fastQCTrimmomatic) után a megadott referenciagenomra illesztjük a mintákat a BWA használataval, majd aGATK programcsomag segítségével azonosítjuk a variánsokat (SNP-k, INDEL-ek). A variánsokat a snpEff nevű szoftverrel végezzük.
 
miRNA pipeline: A miRNA minták minőségellenőrzése (fastQC,Trimmomatic) után a novoalign szoftverrel illesztjük a referenciagenomra a miRBase adatbázis használatával.
 
RNA-seq pipeline:  A nyers fastq fájlok minőségellenőrzése (fastQCTrimmomatic) után a megadott referenciagenomra illesztjük a mintákat a TopHat programmal. Az RPKM értékek kiszámításához aCufflinks programot használunk. Végül a kondíciók összehasonlítása aCuffdiff programmal történik.
 
ChIP-seq (hiszton vagy TF, GRO-seq, ATAC-seq, MNase-seq) pipeline:  A nyers fastq fájlok minőségellenőrzése (fastQCTrimmomatic) után a megadott referenciagenomra illesztjük a mintákat a  BWA programmal. A peakeket a findPeaks.pl programot használjuk a Homer programcsomagból, valamint a MACS2 szoftvert. A peakek alatt feldúsuló motívumok azonosítására  findMotifsGenome.pl programot használjuk a Homer programcsomagból.

 

GENOMOK a szerveren:

/molbio/flatfiles/genomes/index

háziegér – Mus musclus: mm9, mm10
ember – Homo sapiens: hg18, hg19
patkány – Rattus norvegicus: rn4
kenyérélesztő – Saccharomyces cerevisiae: S288c
bortermő szőlő – Vitis vinifera: Vit.vin.GCA_000003745.2
őszibarack – Prunus persica: Pru.per.GCA_000346465.1
házi alma – Malus domestica: Mal.dom.GCF_000148765.1
paradicsom – Solanum lycopersicum: Sol.lyc.SL2.50
dohány – Nicotiana benthamiana: Nic.ben.v1.0.1

Arabidopsis thaliana /data4/molbio/flatfiles/genomes/at
Nicotiana benthamiana /data4/molbio/flatfiles/genomes/nb

LEGFONTOSABB PROGRAMOK:

/data2/programs/tophat-2.1.1.Linux_x86_64/tophat
/data2/programs/cufflinks-2.2.1.Linux_x86_64
/data2/programs/bowtie2-2.2.8
/data2/programs/maker/bin/maker
/molbio/bin/RNA-seq_dj-ah/RNA-seq_main_v3-2.sh
/molbio/bin/ChIP-seq/ChIP-seq_anal-v1_9.sh
/data2/programs/bcftools/bcftools-1.3 - Tools for variant calling and manipulating VCFs and BCFs
/data2/programs/bwa/bwa-0.7.12/ – alignment via Burrows-Wheeler transformation
/data2/programs/impute_v2.3.2 – imputation tool
/data2/programs/R-3.2.3/
/data2/programs/tophat-2.1.1 TopHat maps short sequences from spliced transcripts to whole genomes