20210624

20210624

内部スクリプトの作成

こちらのページを参考にした。https://kazumaxneo.hatenablog.com/entry/2018/12/01/103758

ペアエンドリード間の正確なオーバーラップを検出し、それらをつなぎ合わせてリードを拡張するソフトウェアツール(Paired-end read assembly)

Paired-end read assemblyというのは、MiFishプライマーで増幅されるのはせいぜい200塩基程度だが、HISeqなどで読むと、片側150塩基のペアエンドデータが得られるので、パラメータによりますが20〜30塩基以上重なる領域があれば、ペアエンドをつなげて一本のシングルエンドにしてしまうこと

以下のコマンドを実行することでPaired-end read assemblyが実行できる。

flash pair1.fq(.gz) pair2.fq(.gz)

マージされたシーケンスデータは out.extendedFrags.fastq に出力される。

また-dオプションを使用することで出力先のディレクトリを指定できる。

flash pair1.fq(.gz) pair2.fq(.gz) -d dir/

gz圧縮されたファイルもそのまま使用することができるが、出力はfastq形式(解凍された状態)になる。

-M オプションを使うことでMaxのオーバーラップのサイズ、-m オプションを使うことでMinのオーバーラップのサイズを指定することができる。

MiFishプライマーで増幅されるのはせいぜい200塩基程度、HISeqなどで読むと、片側150塩基のペアエンドデータが得られることからオーバーラップは100塩基程度と想定される。

今回はMinのオーバーラップのサイズはデフォルトの10塩基、Maxのオーバーラップのサイズは300塩基で指定した。

flash pair1.fq(.gz) pair2.fq(.gz) -d dir/ -M 300
  • 20210624.1624511084.txt.gz
  • 最終更新: 2021/06/24 05:04
  • by 133.11.144.10