Formatul FastA

Documentația oficială FastA poate fi găsită aici

Formatul FastA este cel mai de bază format pentru raportarea unei secvențe și este acceptat de aproape toate programele de analiză a secvențelor. Acesta conține doar un nume de secvență, o descriere a secvenței (metadate, informații despre secvențiator, adnotări etc.) și secvența în sine – aceasta poate fi fie acizi nucleici, fie aminoacizi, atâta timp cât respectă formatul.

Care secvență este formată din cel puțin două rânduri:

  1. Primul este antetul secvenței, care începe întotdeauna cu un ‘>’
    • Toate elementele de la începutul ‘>’ până la primul spațiu în alb sunt considerate identificatorul secvenței. Tot ceea ce urmează este considerat descrierea secvenței (aceasta poate fi metadate, numărul de serie al mașinii, orientarea de citire etc.)
  2. Secvența propriu-zisă
    • Rețineți că secvența se poate întinde pe mai multe rânduri, în funcție de lungimea secvenței.
  3. >Chr1 CHROMOSOME dumped from ADB: Jun/20/09 14:53; last updated: 2009-02-02CCCTAAACCCTAAACCCTAAACCCTAAACCTCTGAATCCTTAATCCCTAAATCCCTAAATCTTTAAATCCTACATCCATGAATCCCTAAATACCTAATTCCCTAAACCCGAAACCGGTTTCTCTGGTTGAAAATCATTGTGTATATAATGATAATTTTATCGTTTTTATGTAATTGCTTATTGTTGTGTGTAGATTTTTTAAAAATATCATTTGAGGTCAATACAAATCCTATTTCTTGTGGTTTTCTTTCCTTCACTTAGCTATGGATGGTTTATCTTCATTTGTTATATTGGATACAAGCTTTGCTACGATCTACATTTGGGAATGTGAGTCTCTTATTGTAACCTTAGGGTTGGTTTATCTCAAGAATCTTATTAATTGTTTGGACTGTTTATGTTTGGACATTTATTGTCATTCTTACTCCTTTGTGGAAATGTTTGTTCTATCAATTTATCTTTTGTGGGAAAATTATTTAGTTGTAGGGATGAAGTCTTTCTTCGTTGTTGTTACGCTTGTCATCTCATCTCTCAATGATATGGGATGGTCCTTTAGCATTTATTCTGAAGTTCTTCTGCTTGATGATTTTATCCTTAGCCAAAAGGATTGGTGGTTTGAAGACACATCATATCAAAAAAGCTATCGCCTCGACGATGCTCTATTTCTATCCTTGTAGCACACATTTTGGCACTCAAAAAAGTATTTTTAGATGTTTGTTTTGCTTCTTTGAAGTAGTTTCTCTTTGCAAAATTCCTCTTTTTTTAGAGTGATTTGGATGATTCAAGACTTCTCGGTACTGCAAAGTTCTTCCGCCTGATTAATTATCCATTTTACCTTTGTCGTAGATATTAGGTAATCTGTAAGTCAACTCATATACAACTCATAATTTAAAATAAAATTATGATCGACACACGTTTACACATAAAATCTGTAAATCAACTCATATACCCGTTATTCCCACAATCATATGCTTTCTAAAAGCAAAAGTATATGTCAACAATTGGTTATAAATTATTAGAAGTTTTCCACTTATGACTTAAGAACTTGTGAAGCAGAAAGTGGCAACACCCCCCACCTCCCCCCCCCCCCCCCACCCCCCAAATTGAGAAGTCAATTTTATATAATTTAATCAAATAAATAAGTTTATGGTTAAGAGTTTTTTACTCTCTTTATTTTTCTTTTTCTTT

    Software care utilizează formatul FastA

    În majoritatea cazurilor pe parcursul acestui atelier veți întâlni acest format atunci când utilizați o secvență de referință. Instrumentele de interogare DB, cum ar fi blast și algoritmii de aliniere a secvențelor multiple acceptă doar formatul FastA. De asemenea, atunci când descărcați genomuri de referință, acestea sunt livrate în acest format.

    Cum sunt generate aceste fișiere?

  • Câteva secvențere NGS mai vechi raportează secvențe în acest format. Secvențierea Sanger livrează, de asemenea, în acest format.
  • Majoritatea bazelor de date de secvențe stochează secvențele în format FastA, care este disponibil pentru descărcare.
  • FastA poate fi generat, de asemenea, dintr-un fișier FastQ.

Să luăm unul!

Lasă un răspuns

Adresa ta de email nu va fi publicată.