**文書の過去の版を表示しています。**
NGS解析パイプライン
Portable Pipeline
私(吉武)が担当してきたRNA-seqやメタゲノム解析などで使用した解析フローをパイプライン化したソフトウェア。上記の解析フローも含まれている。RNA-seqはまずこれを使ってみると良いと思う。使用頻度の高そうなde novoのRNA-seqを実行する流れは下記の通り。
まずはzabbixのサーバ負荷状況ページを見て、空いているサーバを選ぶ。Trinityのアセンブルなら、メモリーが200GB以上のサーバを選ぶのが無難。
空いている研究室のサーバにリモートデスクトップでログイン(Win,Mac)したら、まずターミナルを開く。
ターミナルに「PortablePipeline」と打ち込んで、エンターを押す。デフォルトでは「m512p」サーバのディスクに出力されるように設定されている。
Portable Pipelineが起動したら、「RNA-seq~Trinity-kallisto-sleuth
」を選択し、「input1」をクリックしてFASTQファイルを選択する。後々グリッドエンジンを利用して並列に実行したい場合は、「/suikou/files/」以下のディレクトリをたどって目的のFASTQファイルを開くこと。(「/suikou/files」以下は全サーバから同じパス(Path)で見えているため。)
また、「input2」に下記のような1行目のヘッダーに続いて、2行目以降に「フォワード側のFASTQファイル名+スペース/タブ+グループ名」を書いたファイルを指定すると、二群間の総当たりの比較を行ってくれる。input1, input2を両方指定したら「Run」を押す。
id condition 0h_A_1.fq.gz 0h 0h_B_1.fq.gz 0h 1week_A1_1.fq.gz 1w 1week_A2_1.fq.gz 1w
結果としては、こんな感じの結果が出力される。←のデータはサンプルデータでリード数が少なく二群間比較の途中でエラーが出ているけど、結果の雰囲気はこんな感じ。