**文書の過去の版を表示しています。**
RNA-seqデータからSNP解析
解析フロー
基本的に2014/3/6に公開されたGATKの解析フローに基づく。 https://software.broadinstitute.org/gatk/documentation/article.php?id=3891
- STARの2passマッピングを使ってゲノムにRNA-seqデータをマッピング https://github.com/alexdobin/STAR
- GATK HaplotypeCallerでSNP抽出 https://software.broadinstitute.org/gatk/
- 全サンプルで共通するSNPを使ってサンプル間距離をクラスタリング
使い方
- 「work」フォルダ以下に適当なフォルダを作り(例:mkdir ~/work/test-snp)、その中にIlluminaペアエンドシーケンスファイルを置く(未圧縮のFASTQのみ可。gz圧縮されたFASTQファイルは不可)。
- リファレンスゲノム配列(FASTA形式)を同じフォルダに置く。(未圧縮のFASTAのみ可)
- ターミナルを開いて、ファイルを置いたフォルダに移動する(例:cd ~/work/test-snp)。
script-RNAseq-SNPcall-singleend.sh
と入力する。- 結果として、サンプル間距離を表すsample-relation.pdfと、SNPリストとしてoutput.xlsxが得られる。