**文書の過去の版を表示しています。**
各検索アルゴリズムの検討②
SNAP-ALIGNER
ダウンロード
git clone https://github.com/amplab/snap
ディレクトリの移動
cd snap
make
make
DBのindexing
time ./snap-aligner index ~/vsearch/SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa ./ real time: 7:48.83 (468.83 s) system time: 32.05 s user time:2202.93 s
searching
time ./snap-aligner single ./ ../2021nanopore/group4-16S-Sanshiroike2.fq -o snap_output.sam Saw a read of length 1479 while SNAP is compiled with a maximum length of 400. Please use smaller reads or change the value of MAX_READ_LENGTH in SNAPLib/Read.h and recompile SNAP. Read ID: ca774c43-a3b1-4391-b2cf-a56ea4a14f13:33:1511:-1:27F-BC2:1492R SNAP exited with exit code 1 from line 427 of file SNAPLib/Read.h
⇒400bp以上のリードをアラインできないような設定になっていた。定義ファイルを書き換え、より長いリードでもアライン可能にする。
nano SNAPLib/Read.h #define MAX_READ_LENGTH 400
を
#define MAX_READ_LENGTH 40000
に書き換え。
再度makeしなおす。
make clean make
indexも作り直す。
time ./snap-aligner index ~/vsearch/SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa ./ real time: 7:58.83 (478.83 s) system time: 34.59 s user time:2306.29 s max memory: 29161104 KB
再検索
time ./snap-aligner single ./ ../2021nanopore/group4-16S-Sanshiroike2.fq -o snap_output.sam real time: 0:15.37 (15.37 s) system time: 5.38 s user time:2.07 s max memory: 12272472 KB
高速で終了したが、検索では1件もヒットしなかった。⇒nanoporeのデータではエラーが多いため?
Illuminaのデータをダウンロード
cd .. wget http://marine-meta.healthscience.sci.waseda.ac.jp/omd/crest4/fastq/120304_AlnA4_10m_02-08.zip unzip unzip 120304_AlnA4_10m_02-08.zip
再検索
time ./snap-aligner single ./ ../120304_AlnA4_10m_02-08_1.fastq -o snap_output.sam Welcome to SNAP version 2.0.0. Loading index from directory... 44s. 1914206220 bases, seed size 24 Aligning. validateCigarString: saw consecutive ops of the same type 'S' here '57S' in overall cigar '44S57S' SNAP exited with exit code 1 from line 2788 of file SNAPLib/SAM.cpp real time: 0:46.34 (46.34 s) system time: 12.84 s user time:2.35 s max memory: 7574556 KB
⇒snap-alignerのバグ?エラー内容や原因もよくわからないし、snap-alignerは不採用。