差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
参照配列ありrna-seq [2022/09/20 12:40] – [参照配列ありの場合のRNA-seqについて] 210.143.116.87 | 参照配列ありrna-seq [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | # 参照配列ありの場合のRNA-seqについて | ||
- | |||
- | まだ説明ページを作れていないけど、下記のパイプラインをサーバ上で実行すればよい。 | ||
- | |||
- | ``` | ||
- | pp RNA-seq~HISAT2-StringTie-DEGanalysis -c 16 -g ref.gtf -s sample.txt path/ | ||
- | |||
- | ``` | ||
- | |||
- | |||
- | # 以下は古い情報 | ||
- | |||
- | ## 解析の流れとしては、下記のとおり。 | ||
- | |||
- | 1. HISAT2でスプライスサイトを考慮してゲノムにマッピング | ||
- | https:// | ||
- | |||
- | 1. Cufflinksでゲノム中の転写領域を抽出 | ||
- | http:// | ||
- | |||
- | 1. 未知のtranscriptもあり得るので、Trinotateでアノテーション (Uniprotへのblastx, | ||
- | http:// | ||
- | |||
- | 1. blastnでNCBI NTデータベースを検索してアノテーション | ||
- | |||
- | 1. Cuffquant (in Cufflinks package)でgene, | ||
- | |||
- | 1. Cuffdiff (in Cufflinks package)で二群間の比較定量。 | ||
- | |||
- | ## 使い方 | ||
- | |||
- | 1. サーバにログインする。データ量にも依るがメモリ90GB以上のサーバを選ぶほうが無難。[[linux利用方法win|windowsから]], | ||
- | |||
- | 1. 「work」フォルダ以下に適当なフォルダを作り(例:mkdir ~/ | ||
- | |||
- | 1. 次のファイルと同じファイル名のタブ区切りテキストファイルを作成する。内容は、フォワード側のシーケンスファイル名を列挙し、各ファイルの条件をタブ区切りで記入する。(linuxでのテキストファイル編集は```gedit```を使うと楽かも) | ||
- | [[http:// | ||
- | |||
- | 1. リファレンスゲノム配列(FASTA形式)をシーケンスデータと同じフォルダに置く(gz圧縮されたFASTAでも、未圧縮のFASTAでも可能) | ||
- | |||
- | 1. リファレンスゲノムのアノテーションファイル(GTF形式(推奨)、GFF形式)をシーケンスデータと同じフォルダに置く。(gz圧縮不可。もし圧縮されている場合は、```gzip -d annotation.gtf.gz```などとやって解凍しておくこと。また、FASTAファイルと染色体の名前が一致していることを確認すること。例えばFASTAファイルでは染色体1→ chr1となっていて、GTFでは染色体1→ 1という場合は、変換する必要がある。) | ||
- | |||
- | 1. ターミナルを開いて、ファイルを置いたフォルダに移動する(例:cd ~/ | ||
- | |||
- | 1. IlluminaのTruSeq stranded sample prep kitsでサンプル調整した場合は、次のコマンドを入力する。 | ||
- | ``` | ||
- | script-RNAseq-with-reference-pairedend.sh fr-firststrand | ||
- | ``` | ||
- | もしもSRAなどのデータを使うとき、strand specificかわからない場合は、単に | ||
- | ``` | ||
- | script-RNAseq-with-reference-pairedend.sh | ||
- | ``` | ||
- | でよい。 | ||
- | |||
- | 1. 数週間待つと次のような結果ファイルが得られる。 | ||
- | [[http:// | ||
- | [[http:// | ||
- | |||
- | 1. 結果ファイルを開くには、自分のPCにダウンロードしても良いし、サーバ上で```firefox 0_index_isoform.html```, | ||
- | |||
- | |||
- | ## おまけ | ||
- | |||
- | - 実行されたスクリプト本体は、フォルダの中にscript-RNAseq-with-reference-pairedend-main.shとしてコピーされている。 | ||
- | - FASTQCを実行したい場合は、ファイルを入れたフォルダに移動して、```run-multi-fastqc.sh```を実行すれば、次のような結果ファイルが得られる。 | ||
- | [[http:// | ||
- | |||
- | - マッピング状況をゲノムブラウザで可視化したい場合は、[[IGVの使い方]]を参照。 | ||