blastの使い方

BLASTの使い方 CLC編

1.まず大前提として検索したい配列が必要になる。配列を入手するには最初はNCBI Nucleotideのページを見ると良い。https://www.ncbi.nlm.nih.gov/nucleotide/

2.covid 19を検索してみると、次のような結果が得られる。

3.一番上のReference Genomeを開くと詳細な情報が表示される。欲しいのはDNAの配列情報なので、右上の「Send to:」をクリックして、「Complete Record」→「File」→「FASTA」→「Create File」として、FASTAファイルをダウンロードする。(名前はsequence.fastaとなっているはず)

4.CLCの「Standard Import」からダウンロードしたsequence.fastaをインポートする。

5.いろいろなBlastを実行することになると思うけど、一番多いのは、アセンブルした結果のコンティグをデータベースとして、特定の遺伝子の場所、配列を見つけることだと思う。そこで、CLCで「BLAST」→「Create BLAST Database」でまずはデータベースを作成する。

ついでに言うと、BLAST at NCBIは何かNCBIのアップデートが入ったのか、エラーで動かないので、NCBI NT/NRでBLASTしたい場合は素直にNCBIのWEBサイトに行くこと。

6.データベースにしたいアセンブルした結果のコンティグを選択。

7.名前などはそのままでFinish。

8.BLASTを実行するため、BLASTをダブルクリックする。

9.選択する要素は、BLASTのクエリーにしたい配列(例:特定の遺伝子配列など、NCBI Nucleotideでダウンロードした配列)。

10.BLAST databaseには、先ほど作成したデータベースを選択する。

[query]DNA↔[db]DNA間の相同性なら、blastn (DNA vs DNA) or tblastx (翻訳したアミノ酸配列 vs 翻訳したアミノ酸配列)

[query]Protein↔[db]DNA間の相同性なら、tblastn (アミノ酸配列 vs 翻訳したアミノ酸配列)だけど、tblastnはCLCでは選べない。

11.その他のパラメータはとりあえずデフォルトのままNext。極端に短い配列(例えば10塩基など)を検索したい場合は、Word sizeを適当に小さい値に変更してみる。

12.Blastの結果が見られる。

ただ、正直あまり使い勝手は良くない。なので、研究室のサーバにインストールしているローカルBLASTサーバを用いるほうが良さそう。

BLASTの使い方 SequenceServer編

1.手元にクエリーとなるFASTA配列と、データベースとなるFASTA配列がそれぞれあるとする。CLCからFASTA配列のエクスポートはここを参照。

2.まずはデータベースを作成する。http://suikou.fs.a.u-tokyo.ac.jp/upload_sequenceserver/を開き、データベースとなるFASTAファイルをアップロードする。ファイル名がそのまま登録されるので、ファイル名を例えば「yoshitake_covid19.fasta」などと変更しておくこと。(ちなみに一度登録したファイルの削除昨日はついていない。)

こんな結果になれば登録成功。

3.データを登録したら、http://suikou.fs.a.u-tokyo.ac.jp/sequenceserver/のWEBサイトを開き、クエリーのFASTAファイルの中身をコピペする。

BLASTの結果はこんな感じ。

  • blastの使い方.1618851841.txt.gz
  • 最終更新: 2021/04/19 17:04
  • by 118.240.79.152