Mis vahe on FASTA ja FASTQ vahel?

Sisukord:

Mis vahe on FASTA ja FASTQ vahel?
Mis vahe on FASTA ja FASTQ vahel?

Video: Mis vahe on FASTA ja FASTQ vahel?

Video: Mis vahe on FASTA ja FASTQ vahel?
Video: Серёжа спасает ХАГИ ВАГИ и КИСИ МИСИ на фабрике от злого работника фабрики Сборник Серий 2024, Juuli
Anonim

Põhiline erinevus FASTA ja FASTQ vahel on see, et FASTA on tekstipõhine vorming, mis salvestab ainult nukleotiid- või valgujärjestusi, samas kui FASTQ on tekstipõhine vorming, mis salvestab nii järjestuse kui ka seotud järjestuse kvaliteediväärtused.

Bioinformaatika on valdkond, mis kasutab bioloogiliste andmete analüüsimiseks ja mõistmiseks erinevat tarkvara, eriti kui andmekogum on keeruline ja suur. See valdkond ühendab bioloogia, keemia, füüsika, arvutiteaduse, infotehnoloogia, matemaatika ja statistika, et analüüsida ja tõlgendada bioloogilisi andmeid. FASTA ja FASTQ on kaks järjestuste esitusvormingut bioinformaatika valdkonnas järjestuste joondamiseks ja analüüsimiseks. Tegelikult on FASTQ jada failivorming, mis laiendab FASTA vormingut jada kvaliteedi salvestamise võimalusega.

Mis on FASTA?

FASTA on DNA ja valgujärjestuse joondustarkvara. FASTA tarkvara kasutab FASTA vormingut. See on tekstipõhine vorming, mis esindab kas nukleotiidjärjestusi või aminohappe (valgu) järjestusi. Siin tähistavad ühetähelised koodid mõlemat järjestust. FASTA on oluline tööriist bioinformaatika ja biokeemia valdkonnas. See vorming lubab jadadele eelneda jadanimed ja kommentaarid.

FASTA vs FASTQ tabeli kujul
FASTA vs FASTQ tabeli kujul

Joonis 01: FASTA järjestus

See vorming pärineb FASTA tarkvarast ning selle tutvustasid David J. Lipmann ja William R. Pearson 1985. aastal. FASTA tööriista on aja jooksul tehtud palju modifikatsioone ja uusim versioon koosneb programmidest valk:valk, DNA:DNA, valk:tõlgitud DNA (kaadrinihkega) ja järjestatud või järjestamata peptiidiotsingud. FASTA loeb etteantud nukleotiid- või aminohappejärjestuse ja otsib vastava järjestuste andmebaasi, kasutades lokaalset järjestuste joondust, et leida vasteid sarnaste andmebaasijärjestuste jaoks.

Mis on FASTQ?

FASTQ on bioinformaatika valdkonnas kasutatav joondustarkvara, mis salvestab nii bioloogilise järjestuse (tavaliselt nukleotiidjärjestuse) kui ka sellele vastavad kvaliteediskoorid. FASTQ töötati algselt välja Wellcome Trust Sanger Institute'i poolt FASTA-vormingus jada ja sellega seotud kvaliteediandmete koondamiseks. Bioinformaatika valdkonna arenguga sai FASTQ-st de facto standard paljude suure läbilaskevõimega sekveneerimisinstrumentide väljundi salvestamisel.

FASTQ-vorming kasutab järjestuse kohta nelja erinevat rida. 1. rida algab tähega @ ja sellele järgneb järjestuse identifikaator (sarnaselt FASTA pealkirjareale). 2. rida koosneb töötlemata järjestustähtedest. 3. real algab jada märgiga "+" ja sellele järgneb valikuliselt sama jada identifikaator. Rida 4 kodeerib 2. rea jada kvaliteediväärtused ja see peaks koosnema samast arvust sümbolitest kui jada tähtedest.

Millised on FASTA ja FASTQ sarnasused?

  • FASTA ja FASTQ on joondustööriistad.
  • Need on kaks jadaesitusvormingut.
  • Mõlemad on seotud bioinformaatika valdkonnaga.
  • Nii KIIRE kui ka FASTQ on olulised tööriistad salvestamisel ja järjestuse määramisel.
  • FASTQ on FASTA vormingu laiendus, mis võimaldab salvestada jada kvaliteeti.

Mis vahe on FASTA ja FASTQ vahel?

FASTA on tekstipõhine vorming, mis salvestab ainult nukleotiid- või valgujärjestusi, samas kui FASTQ on tekstipõhine vorming, mis salvestab nii järjestuse kui ka seotud järjestuse kvaliteediväärtused. Seega on see peamine erinevus FASTA ja FASTQ vahel. Lisaks salvestab FASTA järjestuse fragmente pärast kaardistamist, samas kui FASTQ salvestab järjestuse fragmente enne kaardistamist. Pealegi on teine erinevus FASTA ja FASTQ vahel see, et FASTA koosneb ühest kirjeldavast reast ja FASTAQ neljast reast.

Allpool olev infograafik esitab FASTA ja FASTQ erinevused kõrvuti võrdlemiseks tabelina.

Kokkuvõte – FASTA vs FASTQ

Bioinformaatika kasutab erinevaid järjestuste vorminguid, nagu FASTA ja FASTQ jne. FASTA salvestab jadafragmendid pärast kaardistamist, FASTQ aga enne kaardistamist. FASTA on DNA ja valgu järjestuse joondamise tarkvara. See koosneb programmidest valk:valk, DNA:DNA, valk:tõlgitud DNA (kaadrinihkega) ja järjestatud või järjestamata peptiidiotsinguteks. FASTQ on bioinformaatika valdkonnas kasutatav joondustarkvara, mis salvestab nii bioloogilise järjestuse (tavaliselt nukleotiidjärjestuse) kui ka sellele vastavad kvaliteediskoorid. FASTA koosneb ühest kirjeldavast reast ja FASTQ neljast reast. Niisiis, see võtab kokku erinevuse FASTA ja FASTQ vahel.

Soovitan: