参照配列なし_de_novo_rna-seq

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
参照配列なし_de_novo_rna-seq [2021/04/12 06:51] 118.240.79.152参照配列なし_de_novo_rna-seq [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1
行 1: 行 1:
-# de novo RNA-seqについて 
- 
-Portable Pipelineで一連の解析が自動で実行されますが、中身を説明すると次のようなツールが使われています。 
- 
-## 解析の流れとしては、下記のとおり。 
- 
-1. Trinityでトランスクリプトームアセンブル 
-https://github.com/trinityrnaseq/trinityrnaseq/wiki 
- 
-1. kallistoでマッピングおよび発現量定量 
-https://pachterlab.github.io/kallisto/ 
- 
-1. Trinotateでアノテーション (Uniprotへのblastx, GOアノテーション、シグナルペプチド予測、膜タンパク質予測、rRNA予測) 
-http://trinotate.github.io/ 
- 
-1. blastnでNCBI NTデータベースを検索してアノテーション 
- 
-1. DESeq2, edgeR, sleuthによる二群間比較検定 
-https://bioconductor.org/packages/release/bioc/html/DESeq2.html 
- 
-## 使い方 
- 
-1. サーバにログインする。データ量にも依るがメモリ90GB以上のサーバを選ぶほうが無難。[[linux利用方法win|windowsから]], [[linux利用方法mac|macから]] 
- 
-1. 「work」フォルダ以下に適当なフォルダを作り(例:mkdir ~/work/test-denovo)、その中にinput_1などと適当にFASTQを入れるディレクトリを作る(例:mkdir ~/work/test-denovo/input_1)。そしてIlluminaペアエンドシーケンスファイルを置く。FASTQファイルもしくはgz圧縮されたFASTQファイル(fastq.gz)に対応。 
- 
-1. 適当にsample.txtなどというファイル名のタブ区切りテキストファイルを作成する。内容は、フォワード側のシーケンスファイル名を列挙し、各ファイルの条件をタブ区切りで記入する。(linuxでのテキストファイル編集は```gedit```を使うと楽かも) 
-[[http://suikou.fs.a.u-tokyo.ac.jp/pp/RNA-seq~HISAT2-StringTie-DEGanalysis/contents/input_4/sample.input2.txt|sample.txt]] 
- 
-1. ターミナルを開いて、ファイルを置いたフォルダに移動する(例:cd ~/work/test-denovo)。 
- 
-1. IlluminaのTruSeq stranded sample prep kitsでサンプル調整した場合は、次のコマンドを入力する。 
-``` 
-/suikou/tool/yoshitake/pp/RNA-seq~Trinity-kallisto-sleuth input_1 sample.txt 
-``` 
-もしもSRAなどのデータを使うとき、strand specificかわからない場合は、 
-``` 
-/suikou/tool/yoshitake/pp/RNA-seq~Trinity-kallisto-sleuth -t "" -k "" input_1 sample.txt 
-``` 
-でよい。 
- 
-1. 数日~数週間待つと次のような結果ファイルが得られる。 
-[[http://suikou.fs.a.u-tokyo.ac.jp/pp/RNA-seq~Trinity-kallisto-sleuth/|0_result.html]] 
- 
-1. 結果ファイルを開くには、自分のPCにダウンロードしても良いし、サーバ上で```firefox 0_result.html```と入力しても良い。 
- 
-- アセンブルしたコンティグのN50などを計算したい場合は、```TrinityStats.pl Trinity.fasta```を実行する。 
- 
-- マッピング状況をゲノムブラウザで可視化したい場合は、[[IGVの使い方]]を参照。 
- 
- 
-## 以下は古いバージョン 
- 
-## 解析の流れとしては、下記のとおり。 
- 
-1. Trinityでトランスクリプトームアセンブル 
-https://github.com/trinityrnaseq/trinityrnaseq/wiki 
- 
-1. kallistoでマッピングおよび発現量定量 
-https://pachterlab.github.io/kallisto/ 
- 
-1. Trinotateでアノテーション (Uniprotへのblastx, GOアノテーション、シグナルペプチド予測、膜タンパク質予測、rRNA予測) 
-http://trinotate.github.io/ 
- 
-1. blastnでNCBI NTデータベースを検索してアノテーション 
- 
-1. DESeq2による二群間比較検定 
-https://bioconductor.org/packages/release/bioc/html/DESeq2.html 
- 
-## 使い方 
- 
-1. サーバにログインする。データ量にも依るがメモリ90GB以上のサーバを選ぶほうが無難。[[linux利用方法win|windowsから]], [[linux利用方法mac|macから]] 
- 
-1. 「work」フォルダ以下に適当なフォルダを作り(例:mkdir ~/work/test-denovo)、その中にIlluminaペアエンドシーケンスファイルを置く(gz圧縮されたFASTQファイルであること)。 
- 
-1. 次のファイルと同じファイル名のタブ区切りテキストファイルを作成する。内容は、フォワード側のシーケンスファイル名を列挙し、各ファイルの条件をタブ区切りで記入する。(linuxでのテキストファイル編集は```gedit```を使うと楽かも) 
-[[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/trinity/sample.txt|sample.txt]] 
- 
-1. ターミナルを開いて、ファイルを置いたフォルダに移動する(例:cd ~/work/test-denovo)。 
- 
-1. IlluminaのTruSeq stranded sample prep kitsでサンプル調整した場合は、次のコマンドを入力する。 
-``` 
-script-RNAseq-denovo-pairedend.sh RF 
-``` 
-もしもSRAなどのデータを使うとき、strand specificかわからない場合は、単に 
-``` 
-script-RNAseq-denovo-pairedend.sh 
-``` 
-でよい。 
- 
-1. 数週間待つと次のような結果ファイルが得られる。 
-[[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/trinity/0_index.html|0_index.html]] 
- 
-1. 結果ファイルを開くには、自分のPCにダウンロードしても良いし、サーバ上で```firefox 0_index.html```と入力しても良い。 
- 
- 
-## おまけ 
- 
-- 実行されたスクリプト本体は、フォルダの中にscript-RNAseq-denovo-strandspecific-pairedend-main.shとしてコピーされている。 
- 
-- FASTQCを実行したい場合は、ファイルを入れたフォルダに移動して、```run-multi-fastqc.sh```を実行すれば、次のような結果ファイルが得られる。 
-[[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/fastqc/index.html|index.html]] 
- 
-- アセンブルしたコンティグのN50などを計算したい場合は、```abyss-fac Trinity.fasta```を実行する。 
- 
-- マッピング状況をゲノムブラウザで可視化したい場合は、[[IGVの使い方]]を参照。 
  
  • 参照配列なし_de_novo_rna-seq.1618210269.txt.gz
  • 最終更新: 2021/04/12 06:51
  • by 118.240.79.152