ngs解析パイプライン

NGS解析パイプライン

Portable Pipeline

私(吉武)が担当してきたRNA-seqやメタゲノム解析などで使用した解析フローをパイプライン化したソフトウェア。上記の解析フローも含まれている。RNA-seqはまずこれを使ってみると良いと思う。使用頻度の高そうなde novoのRNA-seqを実行する流れは下記の通り。

まずはzabbixのサーバ負荷状況ページを見て、空いているサーバを選ぶ。Trinityのアセンブルなら、メモリーが200GB以上のサーバを選ぶのが無難。

空いている研究室のサーバにリモートデスクトップでログイン(Win,Mac)したら、まずターミナルを開く。

ターミナルに「PortablePipeline」と打ち込んで、エンターを押す。デフォルトでは「m512p」サーバのディスクに出力されるように設定されている。

Portable Pipelineが起動したら、「RNA-seq~Trinity-kallisto-sleuth」を選択し、「input1」をクリックしてFASTQファイルを選択する。後々グリッドエンジンを利用して並列に実行したい場合は、「/suikou/files/」以下のディレクトリをたどって目的のFASTQファイルを開くこと。(「/suikou/files」以下は全サーバから同じパス(Path)で見えているため。)

また、「input2」に下記のような1行目のヘッダーに続いて、2行目以降に「フォワード側のFASTQファイル名+スペース/タブ+グループ名」を書いたファイルを指定すると、二群間の総当たりの比較を行ってくれる。input1, input2を両方指定したら「Run」を押す。

id	condition
0h_A_1.fq.gz	0h
0h_B_1.fq.gz	0h
1week_A1_1.fq.gz	1w
1week_A2_1.fq.gz	1w

結果としては、こんな感じの結果が出力される。←のデータはサンプルデータでリード数が少なく二群間比較の途中でエラーが出ているけど、結果の雰囲気はこんな感じ。

  • ngs解析パイプライン.1715764515.txt.gz
  • 最終更新: 2024/05/15 09:15
  • by 193.82.10.99