2021_01_11

各検索アルゴリズムの検討②

ダウンロード

git clone https://github.com/amplab/snap

ディレクトリの移動

cd snap

make

make

DBのindexing

time ./snap-aligner index ~/vsearch/SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa ./
real time: 7:48.83 (468.83 s)
system time: 32.05 s
user time:2202.93 s

searching

time ./snap-aligner single ./ ../2021nanopore/group4-16S-Sanshiroike2.fq -o snap_output.sam
  Saw a read of length 1479 while SNAP is compiled with a maximum length of 400. Please use smaller reads or change the value of 
  MAX_READ_LENGTH in SNAPLib/Read.h and recompile SNAP.  Read ID: ca774c43-a3b1-4391-b2cf-a56ea4a14f13:33:1511:-1:27F-BC2:1492R
  SNAP exited with exit code 1 from line 427 of file SNAPLib/Read.h

⇒400bp以上のリードをアラインできないような設定になっていた。定義ファイルを書き換え、より長いリードでもアライン可能にする。

nano SNAPLib/Read.h

#define MAX_READ_LENGTH 400

#define MAX_READ_LENGTH 40000

に書き換え。

再度makeしなおす。

make clean
make

indexも作り直す。

time ./snap-aligner index ~/vsearch/SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa ./
  real time: 7:58.83 (478.83 s)
  system time: 34.59 s
  user time:2306.29 s
  max memory: 29161104 KB
  

再検索

time ./snap-aligner single ./ ../2021nanopore/group4-16S-Sanshiroike2.fq -o snap_output.sam
  real time: 0:15.37 (15.37 s)
  system time: 5.38 s
  user time:2.07 s
  max memory: 12272472 KB
  

高速で終了したが、検索では1件もヒットしなかった。⇒nanoporeのデータではエラーが多いため?

Illuminaのデータをダウンロード

cd ..
wget http://marine-meta.healthscience.sci.waseda.ac.jp/omd/crest4/fastq/120304_AlnA4_10m_02-08.zip
unzip unzip 120304_AlnA4_10m_02-08.zip

再検索

time ./snap-aligner single ./ ../120304_AlnA4_10m_02-08_1.fastq -o snap_output.sam
  Welcome to SNAP version 2.0.0.
  Loading index from directory... 44s.  1914206220 bases, seed size 24
  Aligning.
  validateCigarString: saw consecutive ops of the same type 'S' here '57S' in overall cigar '44S57S'
  SNAP exited with exit code 1 from line 2788 of file SNAPLib/SAM.cpp
  real time: 0:46.34 (46.34 s)
  system time: 12.84 s
  user time:2.35 s
  max memory: 7574556 KB

⇒snap-alignerのバグ?エラー内容や原因もよくわからないし、snap-alignerは不採用。

  • 2021_01_11.1641907113.txt.gz
  • 最終更新: 2022/01/11 13:18
  • by 133.11.222.89