差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
grid_engineを用いて並列blast [2018/05/08 01:09] – [前準備] 133.11.222.89 | grid_engineを用いて並列blast [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | ====== 前準備 ====== | ||
- | |||
- | 準備として、query側のfastaを複数ファイルに分割しておくとよい。分割ファイル一つ一つのサイズが大きいとノード間の処理性能差が出やすくなってしまうため、多めの分割を行う。30000行程度のfastaファイルを600分割で実行したらいい感じだった。fastaの分割方法→[[fastaファイルを任意の個数のファイルに分割|fastasplit]] | ||
- | |||
- | ====== 1. データベース作成 ====== | ||
- | |||
- | 通常の手順で検索を受ける側のfastaファイルのデータベースを作成する。 | ||
- | <code bash> | ||
- | |||
- | ====== 2. 各ノードにtemporaryフォルダを作成しdbをコピー ====== | ||
- | |||
- | Grid engineシステムはジョブが全てのサーバーに振り分けられるため、各サーバーがローカルのdbファイルにアクセスできるよう'' | ||
- | <code bash> | ||
- | for i in ~/ | ||
- | for i in ~/ | ||
- | </ | ||
- | |||
- | ====== 3. シェルスクリプトの作成 ====== | ||
- | |||
- | 分割したfastaファイルそれぞれに関してBLASTを行うシェルスクリプトを作成。今回のような単一のコマンドを実行する際はこれはいらないかもしれないが、TOPHAT~Cufflinksを並列で最後まで走らせたいときなどはシェルで書くしかない。 | ||
- | <code bash> | ||
- | #!/bin/bash | ||
- | blastp -db ~/ | ||
- | </ | ||
- | |||
- | ====== 4. 実行 ====== | ||
- | |||
- | forループで分割したfasta一つ一つに対し並列でBLASTを実行。 | ||
- | <code bash> | ||
- | for i in ~/ | ||
- | </ | ||
- | |||
- | |||