FastA formátum

A hivatalos FastA dokumentáció itt található

A FastA formátum a legalapvetőbb formátum a szekvencia jelentésére, és szinte minden szekvenciaelemző program elfogadja. Csak egy szekvencia nevet, a szekvencia leírását (metaadatok, szekvenálói információk, megjegyzések stb.) és magát a szekvenciát tartalmazza – ez lehet akár nukleinsav, akár aminosav, amíg betartja a formátumot.

Minden szekvencia legalább két sorból áll:

  1. Az első a szekvencia fejléc, amely mindig ‘>’
    • Az ‘>’ kezdetétől az első szóközig minden a szekvencia azonosítójának számít. Minden, ami ezután következik, a szekvencia leírásának tekinthető (ez lehet metaadat, gép sorszáma, olvasási orientáció stb.)
  2. A szekvencia maga
    • Megjegyezzük, hogy a szekvencia hossza függvényében a szekvencia több soron is átívelhet.
>Chr1 CHROMOSOME dumped from ADB: Jun/20/09 14:53; last updated: 2009-02-02CCCTAAACCCTAAACCCTAAACCCTAAACCTCTGAATCCTTAATCCCTAAATCCCTAAATCTTTAAATCCTACATCCATGAATCCCTAAATACCTAATTCCCTAAACCCGAAACCGGTTTCTCTGGTTGAAAATCATTGTGTATATAATGATAATTTTATCGTTTTTATGTAATTGCTTATTGTTGTGTGTAGATTTTTTAAAAATATCATTTGAGGTCAATACAAATCCTATTTCTTGTGGTTTTCTTTCCTTCACTTAGCTATGGATGGTTTATCTTCATTTGTTATATTGGATACAAGCTTTGCTACGATCTACATTTGGGAATGTGAGTCTCTTATTGTAACCTTAGGGTTGGTTTATCTCAAGAATCTTATTAATTGTTTGGACTGTTTATGTTTGGACATTTATTGTCATTCTTACTCCTTTGTGGAAATGTTTGTTCTATCAATTTATCTTTTGTGGGAAAATTATTTAGTTGTAGGGATGAAGTCTTTCTTCGTTGTTGTTACGCTTGTCATCTCATCTCTCAATGATATGGGATGGTCCTTTAGCATTTATTCTGAAGTTCTTCTGCTTGATGATTTTATCCTTAGCCAAAAGGATTGGTGGTTTGAAGACACATCATATCAAAAAAGCTATCGCCTCGACGATGCTCTATTTCTATCCTTGTAGCACACATTTTGGCACTCAAAAAAGTATTTTTAGATGTTTGTTTTGCTTCTTTGAAGTAGTTTCTCTTTGCAAAATTCCTCTTTTTTTAGAGTGATTTGGATGATTCAAGACTTCTCGGTACTGCAAAGTTCTTCCGCCTGATTAATTATCCATTTTACCTTTGTCGTAGATATTAGGTAATCTGTAAGTCAACTCATATACAACTCATAATTTAAAATAAAATTATGATCGACACACGTTTACACATAAAATCTGTAAATCAACTCATATACCCGTTATTCCCACAATCATATGCTTTCTAAAAGCAAAAGTATATGTCAACAATTGGTTATAAATTATTAGAAGTTTTCCACTTATGACTTAAGAACTTGTGAAGCAGAAAGTGGCAACACCCCCCACCTCCCCCCCCCCCCCCCACCCCCCAAATTGAGAAGTCAATTTTATATAATTTAATCAAATAAATAAGTTTATGGTTAAGAGTTTTTTACTCTCTTTATTTTTCTTTTTCTTT

A FastA formátumot használó szoftverek

A legtöbb esetben a workshop során ezzel a formátummal fog találkozni, amikor referencia szekvenciát használ. A DB-lekérdező eszközök, mint a blast és a többszekvencia-illesztési algoritmusok csak a FastA formátumot fogadják el. Továbbá, amikor referencia genomokat tölt le, azokat ebben a formátumban szállítják.

Hogyan generálják ezeket a fájlokat?

  • Néhány régebbi NGS szekvenáló ebben a formátumban jelenti a szekvenciákat. A Sanger szekvenálás is ebben a formátumban szállít.
  • A legtöbb szekvencia adatbázis FastA formátumban tárolja a szekvenciákat, ami letölthető.
  • FastA is generálható FastQ fájlból.

Kapjunk egyet!

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.