差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
2021_11_16 [2021/11/16 13:35] – 133.11.222.89 | 2021_11_16 [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | 20211116 | ||
- | |||
- | リモートアクセス | ||
- | |||
- | ssh -l accountname ipaddress | ||
- | |||
- | 「time」コマンドを用いて、コマンド実行にかかる時間、メモリを表示する。↓はメモリ表示の追加コマンド | ||
- | |||
- | alias time='/ | ||
- | | ||
- | SILVAデータベースのダウンロード | ||
- | |||
- | wget https:// | ||
- | |||
- | 学生実験nanoporeデータのダウンロード | ||
- | |||
- | wget http:// | ||
- | |||
- | nanopore.zipの展開 | ||
- | |||
- | unzip 2021nanopore | ||
- | | ||
- | SILVAデータベースの展開 | ||
- | |||
- | gzip -d SILVA_138.1_SSURef_NR99_tax_silva_trunc.fasta.gz | ||
- | | ||
- | SILVAデータベースのmakeblastdb | ||
- | |||
- | makeblastdb -in SILVA_138.1_SSURef_NR99_tax_silva_trunc.fasta -dbtype nucl | ||
- | | ||
- | nanoporeフォルダへの移動 | ||
- | |||
- | cd 2021nanopore/ | ||
- | | ||
- | fatsqファイルのfastaファイルへの変換 | ||
- | |||
- | awk ' | ||
- | | ||
- | vsearchフォルダへの移動 | ||
- | |||
- | cd ../ | ||
- | |||
- | Blast検索 | ||
- | |||
- | time blastn -db SILVA_138.1_SSURef_NR99_tax_silva_trunc.fasta -query 2021nanopore/ | ||
- | | ||
- | ^Creal time: 3:59.38 (239.38 s) | ||
- | system time: 45.88 s | ||
- | user time: | ||
- | max memory: 332916 KB | ||
- | | ||
- | nanoporeフォルダへの移動 | ||
- | |||
- | cd 2021nanopore/ | ||
- | | ||
- | group4-16Sデータのfasta変換 | ||
- | |||
- | awk ' | ||
- | | ||
- | Blast検索 | ||
- | |||
- | time blastn -db SILVA_138.1_SSURef_NR99_tax_silva_trunc.fasta -query 2021nanopore/ | ||
- | |||
- | real time: 3:42.29 (222.29 s) | ||
- | system time: 0.11 s | ||
- | user time:221.29 s | ||
- | max memory: 254756 KB | ||
- | | ||
- | 同じファイルをvsearch(一致率90%以上) | ||
- | |||
- | time vsearch --usearch_global 2021nanopore/ | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | | ||
- | real time: 0:33.37 (33.37 s) | ||
- | | ||
- | user time:201.71 s | ||
- | max memory: 2912392 KB | ||
- | |||
- | リモートアクセスの終了 | ||
- | |||
- | exit | ||
- | | ||
- | リモートサーバから自分のサーバへのファイル送信 | ||
- | |||
- | scp -r mizobata@192.168.251.65:/ | ||
- | | ||
- | →Blast解析結果とvsearch結果を送信し、エクセル上で「重複除去」などを用いて精度を確認する。 | ||
- | |||
- | vsearchの一致率90%検索では全リードに対して候補を得られなかったため、70%に落として再検索 | ||
- | |||
- | time vsearch --usearch_global 2021nanopore/ | ||
- | |||
- | vsearch v2.18.0_linux_x86_64, | ||
- | https:// | ||
- | Reading file SILVA_138.1_SSURef_NR99_tax_silva_trunc.fasta 100% | ||
- | 744168630 nt in 510508 seqs, min 900, max 3718, avg 1458 | ||
- | Masking 100% | ||
- | Counting k-mers 100% | ||
- | Creating k-mer index 100% | ||
- | Searching 100% | ||
- | Matching unique query sequences: 40 of 40 (100.00%) | ||
- | real 0m32.963s | ||
- | user 3m20.277s | ||
- | sys | ||
- | |||
- | vsearchでは毎回index作成(makeblastdbのようなもの)するため、何度も検索をかける場合は先にDBを構築しておく方が効率的である。↓ | ||
- | |||
- | vsearch -makeudb_usearch SILVA_138.1_SSURef_NR99_tax_silva_trunc.fasta -output SILVA_138.1_SSURef_NR99_tax_silva_trunc.udb | ||
- | | ||
- | これにより、vsearchの所要時間が30秒程度から7秒に短縮された。↓ | ||
- | |||
- | time vsearch --usearch_global 2021nanopore/ | ||
- | |||
- | vsearch v2.18.0_linux_x86_64, | ||
- | https:// | ||
- | Reading UDB file SILVA_138.1_SSURef_NR99_tax_silva_trunc.udb 100% | ||
- | Reorganizing data in memory 100% | ||
- | Creating bitmaps 100% | ||
- | Parsing abundances 100% | ||
- | 744168630 nt in 510508 seqs, min 900, max 3718, avg 1458 | ||
- | Searching 100% | ||
- | Matching unique query sequences: 40 of 40 (100.00%) | ||
- | real 0m7.234s | ||
- | user 0m4.321s | ||
- | sys | ||
- | |||
- | vsearchにおいて事前にDBを作成しておけば、Blastにて3分半ほどかかる検索が7秒で終了した。(単純計算では30倍) | ||
- | |||
- | DB作成は1GBほどのSILVA DBにおいて2, | ||
- | |||
- | vsearchトップヒット結果のBlastとの一致率は25/ | ||
- | |||
- | |||
- | |||