**文書の過去の版を表示しています。**
20210624
内部スクリプトの作成
Flashの使い方
Flashとは
ペアエンドリード間の正確なオーバーラップを検出し、それらをつなぎ合わせてリードを拡張するソフトウェアツール(Paired-end read assembly)
Paired-end read assemblyとは
Paired-end read assemblyというのは、MiFishプライマーで増幅されるのはせいぜい200塩基程度だが、HISeqなどで読むと、片側150塩基のペアエンドデータが得られるので、パラメータによりますが20〜30塩基以上重なる領域があれば、ペアエンドをつなげて一本のシングルエンドにしてしまうこと
コマンド
以下のコマンドを実行することでPaired-end read assemblyが実行できる。
flash pair1.fq(.gz) pair2.fq(.gz)
マージされたシーケンスデータは out.extendedFrags.fastq
に出力される。
また-d
オプションを使用することで出力先のディレクトリを指定できる。
flash pair1.fq(.gz) pair2.fq(.gz) -d dir/
gz圧縮されたファイルもそのまま使用することができるが、出力はfastq形式(解凍された状態)になる。
オーバーラップのサイズのパラメータの設定
-M
オプションを使うことでMaxのオーバーラップのサイズ、-m
オプションを使うことでMinのオーバーラップのサイズを指定することができる。
MiFishプライマーで増幅されるのはせいぜい200塩基程度、HISeqなどで読むと、片側150塩基のペアエンドデータが得られることからオーバーラップは100塩基程度と想定される。
今回はMinのオーバーラップのサイズはデフォルトの10塩基、Maxのオーバーラップのサイズは300塩基で指定した。
flash pair1.fq(.gz) pair2.fq(.gz) -d dir/ -M 300