FastA formátum
A hivatalos FastA dokumentáció itt található
A FastA formátum a legalapvetőbb formátum a szekvencia jelentésére, és szinte minden szekvenciaelemző program elfogadja. Csak egy szekvencia nevet, a szekvencia leírását (metaadatok, szekvenálói információk, megjegyzések stb.) és magát a szekvenciát tartalmazza – ez lehet akár nukleinsav, akár aminosav, amíg betartja a formátumot.
Minden szekvencia legalább két sorból áll:
- Az első a szekvencia fejléc, amely mindig ‘>’
- Az ‘>’ kezdetétől az első szóközig minden a szekvencia azonosítójának számít. Minden, ami ezután következik, a szekvencia leírásának tekinthető (ez lehet metaadat, gép sorszáma, olvasási orientáció stb.)
- A szekvencia maga
- Megjegyezzük, hogy a szekvencia hossza függvényében a szekvencia több soron is átívelhet.
>Chr1 CHROMOSOME dumped from ADB: Jun/20/09 14:53; last updated: 2009-02-02CCCTAAACCCTAAACCCTAAACCCTAAACCTCTGAATCCTTAATCCCTAAATCCCTAAATCTTTAAATCCTACATCCATGAATCCCTAAATACCTAATTCCCTAAACCCGAAACCGGTTTCTCTGGTTGAAAATCATTGTGTATATAATGATAATTTTATCGTTTTTATGTAATTGCTTATTGTTGTGTGTAGATTTTTTAAAAATATCATTTGAGGTCAATACAAATCCTATTTCTTGTGGTTTTCTTTCCTTCACTTAGCTATGGATGGTTTATCTTCATTTGTTATATTGGATACAAGCTTTGCTACGATCTACATTTGGGAATGTGAGTCTCTTATTGTAACCTTAGGGTTGGTTTATCTCAAGAATCTTATTAATTGTTTGGACTGTTTATGTTTGGACATTTATTGTCATTCTTACTCCTTTGTGGAAATGTTTGTTCTATCAATTTATCTTTTGTGGGAAAATTATTTAGTTGTAGGGATGAAGTCTTTCTTCGTTGTTGTTACGCTTGTCATCTCATCTCTCAATGATATGGGATGGTCCTTTAGCATTTATTCTGAAGTTCTTCTGCTTGATGATTTTATCCTTAGCCAAAAGGATTGGTGGTTTGAAGACACATCATATCAAAAAAGCTATCGCCTCGACGATGCTCTATTTCTATCCTTGTAGCACACATTTTGGCACTCAAAAAAGTATTTTTAGATGTTTGTTTTGCTTCTTTGAAGTAGTTTCTCTTTGCAAAATTCCTCTTTTTTTAGAGTGATTTGGATGATTCAAGACTTCTCGGTACTGCAAAGTTCTTCCGCCTGATTAATTATCCATTTTACCTTTGTCGTAGATATTAGGTAATCTGTAAGTCAACTCATATACAACTCATAATTTAAAATAAAATTATGATCGACACACGTTTACACATAAAATCTGTAAATCAACTCATATACCCGTTATTCCCACAATCATATGCTTTCTAAAAGCAAAAGTATATGTCAACAATTGGTTATAAATTATTAGAAGTTTTCCACTTATGACTTAAGAACTTGTGAAGCAGAAAGTGGCAACACCCCCCACCTCCCCCCCCCCCCCCCACCCCCCAAATTGAGAAGTCAATTTTATATAATTTAATCAAATAAATAAGTTTATGGTTAAGAGTTTTTTACTCTCTTTATTTTTCTTTTTCTTT
A FastA formátumot használó szoftverek
A legtöbb esetben a workshop során ezzel a formátummal fog találkozni, amikor referencia szekvenciát használ. A DB-lekérdező eszközök, mint a blast és a többszekvencia-illesztési algoritmusok csak a FastA formátumot fogadják el. Továbbá, amikor referencia genomokat tölt le, azokat ebben a formátumban szállítják.
Hogyan generálják ezeket a fájlokat?
- Néhány régebbi NGS szekvenáló ebben a formátumban jelenti a szekvenciákat. A Sanger szekvenálás is ebben a formátumban szállít.
- A legtöbb szekvencia adatbázis FastA formátumban tárolja a szekvenciákat, ami letölthető.
- FastA is generálható FastQ fájlból.