**文書の過去の版を表示しています。**
BLASTの使い方 CLC編
1.まず大前提として検索したい配列が必要になる。配列を入手するには最初はNCBI Nucleotideのページを見ると良い。https://www.ncbi.nlm.nih.gov/nucleotide/
2.covid 19を検索してみると、次のような結果が得られる。
3.一番上のReference Genomeを開くと詳細な情報が表示される。欲しいのはDNAの配列情報なので、右上の「Send to:」をクリックして、「Complete Record」→「File」→「FASTA」→「Create File」として、FASTAファイルをダウンロードする。(名前はsequence.fastaとなっているはず)
4.CLCの「Standard Import」からダウンロードしたsequence.fastaをインポートする。
5.いろいろなBlastを実行することになると思うけど、一番多いのは、アセンブルした結果のコンティグをデータベースとして、特定の遺伝子の場所、配列を見つけることだと思う。そこで、CLCで「BLAST」→「Create BLAST Database」でまずはデータベースを作成する。
ついでに言うと、BLAST at NCBIは何かNCBIのアップデートが入ったのか、エラーで動かないので、NCBI NT/NRでBLASTしたい場合は素直にNCBIのWEBサイトに行くこと。
6.データベースにしたいアセンブルした結果のコンティグを選択。
7.名前などはそのままでFinish。
8.BLASTを実行するため、BLASTをダブルクリックする。
9.選択する要素は、BLASTのクエリーにしたい配列(例:特定の遺伝子配列など、NCBI Nucleotideでダウンロードした配列)。
10.BLAST databaseには、先ほど作成したデータベースを選択する。
[query]DNA↔[db]DNA間の相同性なら、blastn (DNA vs DNA) or tblastx (翻訳したアミノ酸配列 vs 翻訳したアミノ酸配列)
[query]Protein↔[db]DNA間の相同性なら、tblastn (アミノ酸配列 vs 翻訳したアミノ酸配列)だけど、tblastnはCLCでは選べない。
11.その他のパラメータはとりあえずデフォルトのままNext。極端に短い配列(例えば10塩基など)を検索したい場合は、Word sizeを適当に小さい値に変更してみる。
12.Blastの結果が見られる。
ただ、正直あまり使い勝手は良くない。なので、研究室のサーバにインストールしているローカルBLASTサーバを用いるほうが良さそう。
BLASTの使い方 SequenceServer編
1.手元にクエリーとなるFASTA配列と、データベースとなるFASTA配列がそれぞれあるとする。CLCからFASTA配列のエクスポートはここを参照。
2.まずはデータベースを作成する。http://suikou.fs.a.u-tokyo.ac.jp/upload_sequenceserver/を開き、データベースとなるFASTAファイルをアップロードする。ファイル名がそのまま登録されるので、ファイル名を例えば「yoshitake_covid19.fasta」などと変更しておくこと。(ちなみに一度登録したファイルの削除昨日はついていない。)
こんな結果になれば登録成功。
3.データを登録したら、http://suikou.fs.a.u-tokyo.ac.jp/sequenceserver/のWEBサイトを開き、クエリーのFASTAファイルの中身をコピペする。
BLASTの結果はこんな感じ。