**文書の過去の版を表示しています。**
de novo RNA-seqについて
解析の流れとしては、下記のとおり。
- Trinityでトランスクリプトームアセンブル https://github.com/trinityrnaseq/trinityrnaseq/wiki
- kallistoでマッピングおよび発現量定量 https://pachterlab.github.io/kallisto/
- Trinotateでアノテーション (Uniprotへのblastx, GOアノテーション、シグナルペプチド予測、膜タンパク質予測、rRNA予測) http://trinotate.github.io/
- blastnでNCBI NTデータベースを検索してアノテーション
- DESeq2による二群間比較検定 https://bioconductor.org/packages/release/bioc/html/DESeq2.html
使い方
- 「work」フォルダ以下に適当なフォルダを作り(例:mkdir ~/work/test-denovo)、その中にIlluminaペアエンドシーケンスファイルを置く(gz圧縮されたFASTQファイルであること)。
- 次のファイルと同じファイル名のタブ区切りテキストファイルを作成する。内容は、フォワード側のシーケンスファイル名を列挙し、各ファイルの条件をタブ区切りで記入する。(linuxでのテキストファイル編集は
gedit
を使うと楽かも) sample.txt - ターミナルを開いて、ファイルを置いたフォルダに移動する(例:cd ~/work/test-denovo)。
- IlluminaのTruSeq stranded sample prep kitsでサンプル調整した場合は、次のコマンドを入力する。
script-RNAseq-denovo-strandspecific-pairedend.sh RF
もしもSRAなどのデータを使うとき、strand specificかわからない場合は、単にscript-RNAseq-denovo-strandspecific-pairedend.sh
でよい。 - 数週間待つと次のような結果ファイルが得られる。 0_index.html
おまけ
- FASTQCを実行したい場合は、ファイルを入れたフォルダに移動して、
run-multi-fastqc.sh
を実行すれば、次のような結果ファイルが得られる。 index.html - アセンブルしたコンティグのN50などを計算したい場合は、
abyss-fac Trinity.fasta
を実行する。