2021_12_28

各検索アルゴリズムの検討

blastnを用いた検索

DBの作成

makeblastdb -in SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa -dbtype nucl

検索

time blastn -db SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa -query group4-16S-Sanshiroike2.fasta -num_threads 1 -out group4-16S.fasta.blastn
  real time: 0:42.16 (42.16 s)
  system time: 0.35 s
  user time:40.96 s
  max memory: 505620 KB

vsearchを用いた検索

DBファイルのダウンロード

scp mizobata.hideaki@m768c.s:/suikou/db/ncbi/2021-12-01_SSU_LSU_ITS_mito_plastid/SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa .

DBファイルのmakeudb

time vsearch -makeudb_usearch SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa -output conbined.udb
  real time: 1:41.38 (101.38 s)
  system time: 2.17 s
  user time:98.97 s
  max memory: 1381728 KB

vsearchによるグローバル検索

time vsearch --usearch_global 2021nanopore/group4-16S-Sanshiroike2.fasta --db conbined.udb --id 0.7 --blast6out group4-16S-conbined
  real time: 0:51.12 (51.12 s)
  system time: 5.07 s
  user time:579.42 s
  max memory: 1664640 KB

Megan用に、拡張子等を書き換える

awk -F'\t' '{OFS="\t"; $12=$3; print $0}' group4-16S-conbined > group4-16S-conbined.blastn

仮想サーバからログアウト

exit

先ほどのファイルをローカルサーバに持ってくる

scp -r mizobata@192.168.251.65:/home/mizobata/vsearch/group4-16S-conbined.blastn .

bwaのインストール

bwa用フォルダの作成

mkdir analysis

bwaのダウンロード

wget https://sourceforge.net/projects/bio-bwa/files/bwa-0.7.17.tar.bz2

ファイルの解凍

bunzip2 bwa-0.7.17.tar.bz2
tar xvf bwa-0.7.17.tar

フォルダの移動

cd bwa-0.7.17/

zlib-develのインストール

sudo yum install zlib-devel

make

make

bwaを用いた検索

DBのダウンロード

scp mizobata.hideaki@m768c.s:/suikou/db/ncbi/2021-12-01_SSU_LSU_ITS_mito_plastid/SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa .

DBのindexing。

-p:アウトプットファイル名の指定。

-a:indexing法の指定。is,bwtswが指定可能。isの方が簡潔で速いが、大容量DBには指定できない。

time bwa-0.7.17/bwa index -p ./bwadb -a bwtsw SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa
  real time: 29:23.56 (1763.56 s)
  system time: 4.63 s
  user time:1751.60 s
  max memory: 2355196 KB

bwaを用いた検索

time bwa-0.7.17/bwa mem bwadb group4-16S-Sanshiroike2.fasta > group4-16S-Sanshiroike2.sam
  real time: 0:07.43 (7.43 s)
  system time: 1.45 s
  user time:4.24 s
  max memory: 2753976 KB

Meganで読み込めるよう、awkで改変

cat group4-16S.sam|grep -v "^@"|awk '$3!="*" && old!=$1{old=$1; print $0}'|awk '{print $1"\t"$3"\t100\t100\t0\t0\t1\t100\t1\t100\t0\t100"}' > group4-16S.sam.blastn

ログアウト

exit

先ほどのファイルをローカルへ持ってくる

scp -r mizobata@192.168.251.65:/home/mizobata/analysis/group4-16S.sam.blastn .

bwa-mem2のインストール

mem2のダウンロード

wget https://github.com/bwa-mem2/bwa-mem2/releases/download/v2.0pre2/bwa-mem2-2.0pre2_x64-linux.tar.bz2

解凍

bunzip2 bwa-mem2-2.0pre2_x64-linux.tar.bz2
tar xvf bwa-mem2-2.0pre2_x64-linux.tar

ディレクトリの変更

cd bwa-mem2-2.0pre2_x64-linux/

実行

./bwa-mem2
  Please verify that both the operating system and the processor support Intel(R) X87, CMOV, MMX, FXSAVE, SSE, SSE2, SSE3, SSSE3, SSE4_1, SSE4_2, MOVBE, POPCNT, F16C, AVX, FMA, BMI, LZCNT and AVX2 instructions.
  

⇒このPCではCPUの規格が合わなかった….

Meganを用いた各結果の比較

  1. Meganを開く。
  2. File ⇒ Import from BLAST
  3. Importファイルには検索結果ファイルを指定。FormatはBlastTAB,タイプはBlastN。
  4. Taxonomy ⇒ Load MeganMapDB mapping File ⇒ megan-nucl-Jan201.dbを指定し、Apply。
  5. 以上を各結果について行う。
  6. File ⇒ Compareで対象結果をすべて選択し、比較する。

bwa(橙),vsearch(青),blastn(桃)の結果比較(Genusレベル)。

  • 2021_12_28.1640689170.txt.gz
  • 最終更新: 2021/12/28 10:59
  • by 133.11.222.89