参照配列なし_de_novo_rna-seq

de novo RNA-seqについて

  1. Trinityでトランスクリプトームアセンブル https://github.com/trinityrnaseq/trinityrnaseq/wiki
  2. kallistoでマッピングおよび発現量定量 https://pachterlab.github.io/kallisto/
  3. Trinotateでアノテーション (Uniprotへのblastx, GOアノテーションを含む) http://trinotate.github.io/
  4. blastnでNCBI NTデータベースを検索してアノテーション
  1. サーバにログインする。データ量にも依るがメモリ90GB以上のサーバを選ぶほうが無難。windowsから, macから
  2. 「work」フォルダ以下に適当なフォルダを作り(例:mkdir ~/work/test-denovo)、その中にIlluminaペアエンドシーケンスファイルを置く(gz圧縮されたFASTQファイルであること)。
  3. 次のファイルと同じようなタブ区切りテキストファイルを作成する。内容は、フォワード側のシーケンスファイル名を列挙し、各ファイルの条件をタブ区切りで記入する。 sample.txt
  4. ターミナルを開いて、ファイルを置いたフォルダに移動する(例:cd ~/work/test-denovo)。
  5. IlluminaのTruSeq stranded sample prep kitsでサンプル調整した場合は、次のコマンドを入力する。 script-RNAseq-denovo-strandspecific-pairedend.sh RF もしもSRAなどのデータを使うとき、strand specificかわからない場合は、単に script-RNAseq-denovo-strandspecific-pairedend.sh でよい。
  6. 数週間待つと次のような結果ファイルが得られる。 0_index.html
  • 参照配列なし_de_novo_rna-seq.1506726529.txt.gz
  • 最終更新: 2017/09/29 23:08
  • by suikou