NGS解析パイプライン

私（吉武）が担当してきたRNA-seqやメタゲノム解析などで使用した解析フローをパイプライン化したソフトウェア。上記の解析フローも含まれている。RNA-seqはまずこれを使ってみると良いと思う。使用頻度の高そうなde novoのRNA-seqを実行する流れは下記の通り。

まずはzabbixのサーバ負荷状況ページを見て、空いているサーバを選ぶ。Trinityのアセンブルなら、メモリーが200GB以上のサーバを選ぶのが無難。

空いている研究室のサーバにリモートデスクトップでログイン(Win,Mac)したら、まずターミナルを開く。

ターミナルに「PortablePipeline」と打ち込んで、エンターを押す。デフォルトでは「m512p」サーバのディスクに出力されるように設定されている。

Portable Pipelineが起動したら、「RNA-seq~Trinity-kallisto-sleuth」を選択し、「input1」をクリックしてFASTQファイルを選択する。後々グリッドエンジンを利用して並列に実行したい場合は、「/suikou/files/」以下のディレクトリをたどって目的のFASTQファイルを開くこと。（「/suikou/files」以下は全サーバから同じパス(Path)で見えているため。）

また、「input2」に下記のような1行目のヘッダーに続いて、2行目以降に「フォワード側のFASTQファイル名＋スペース/タブ+グループ名」を書いたファイルを指定すると、二群間の総当たりの比較を行ってくれる。input1, input2を両方指定したら「Run」を押す。

id	condition
0h_A_1.fq.gz	0h
0h_B_1.fq.gz	0h
1week_A1_1.fq.gz	1w
1week_A2_1.fq.gz	1w

結果としては、こんな感じの結果が出力される。←のデータはサンプルデータでリード数が少なく二群間比較の途中でエラーが出ているけど、結果の雰囲気はこんな感じ。

文書の過去の版を表示しています。

NGS解析パイプライン

Portable Pipeline

講義ノート

**文書の過去の版を表示しています。**

NGS解析パイプライン

Portable Pipeline

文書の過去の版を表示しています。