FastA Format

FastA公式ドキュメントはこちら

FastAフォーマットは配列を報告するための最も基本的なフォーマットで、ほぼすべての配列解析プログラムで受け入れられています。 配列名、配列の説明(メタデータ、シーケンサー情報、注釈など)、配列そのものが含まれているだけで、フォーマットに沿っていれば、核酸でもアミノ酸でも構いません。

各配列は少なくとも2行で構成されています。

  1. 1行目は配列ヘッダーで、常に ‘>’
    • から最初の空白文字までが配列識別子とみなされます。 それ以降は配列の説明となります(メタデータ、マシンシリアル番号、読み取り方向など)
  2. 配列自体
    • 配列の長さによっては、複数の行にまたがることがあることに注意してください
>Chr1 CHROMOSOME dumped from ADB: Jun/20/09 14:53; last updated: 2009-02-02CCCTAAACCCTAAACCCTAAACCCTAAACCTCTGAATCCTTAATCCCTAAATCCCTAAATCTTTAAATCCTACATCCATGAATCCCTAAATACCTAATTCCCTAAACCCGAAACCGGTTTCTCTGGTTGAAAATCATTGTGTATATAATGATAATTTTATCGTTTTTATGTAATTGCTTATTGTTGTGTGTAGATTTTTTAAAAATATCATTTGAGGTCAATACAAATCCTATTTCTTGTGGTTTTCTTTCCTTCACTTAGCTATGGATGGTTTATCTTCATTTGTTATATTGGATACAAGCTTTGCTACGATCTACATTTGGGAATGTGAGTCTCTTATTGTAACCTTAGGGTTGGTTTATCTCAAGAATCTTATTAATTGTTTGGACTGTTTATGTTTGGACATTTATTGTCATTCTTACTCCTTTGTGGAAATGTTTGTTCTATCAATTTATCTTTTGTGGGAAAATTATTTAGTTGTAGGGATGAAGTCTTTCTTCGTTGTTGTTACGCTTGTCATCTCATCTCTCAATGATATGGGATGGTCCTTTAGCATTTATTCTGAAGTTCTTCTGCTTGATGATTTTATCCTTAGCCAAAAGGATTGGTGGTTTGAAGACACATCATATCAAAAAAGCTATCGCCTCGACGATGCTCTATTTCTATCCTTGTAGCACACATTTTGGCACTCAAAAAAGTATTTTTAGATGTTTGTTTTGCTTCTTTGAAGTAGTTTCTCTTTGCAAAATTCCTCTTTTTTTAGAGTGATTTGGATGATTCAAGACTTCTCGGTACTGCAAAGTTCTTCCGCCTGATTAATTATCCATTTTACCTTTGTCGTAGATATTAGGTAATCTGTAAGTCAACTCATATACAACTCATAATTTAAAATAAAATTATGATCGACACACGTTTACACATAAAATCTGTAAATCAACTCATATACCCGTTATTCCCACAATCATATGCTTTCTAAAAGCAAAAGTATATGTCAACAATTGGTTATAAATTATTAGAAGTTTTCCACTTATGACTTAAGAACTTGTGAAGCAGAAAGTGGCAACACCCCCCACCTCCCCCCCCCCCCCCCACCCCCCAAATTGAGAAGTCAATTTTATATAATTTAATCAAATAAATAAGTTTATGGTTAAGAGTTTTTTACTCTCTTTATTTTTCTTTTTCTTT

FastAフォーマットを使用するソフトウェア

このワークショップを通してほとんどの場合、参照シーケンスを使う際にこのフォーマットを目にします。 BlastのようなDBクエリーツールや、マルチプルシーケンスアライメントアルゴリズムは、FastAフォーマットしか受け付けません。 また、参照ゲノムをダウンロードする際にも、このフォーマットで提供されます。

  • ほとんどの配列データベースは、ダウンロード可能なFastAフォーマットで配列を保存しています。
  • コメントを残す

    メールアドレスが公開されることはありません。