差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン 次のリビジョン両方とも次のリビジョン | ||
バイオインフォマティクス_ツールインストール方法_2019 [2019/07/20 11:28] – [スパコンや研究室のクラスターPCでの利用] suikou | バイオインフォマティクス_ツールインストール方法_2019 [2019/09/24 10:30] – [Windows] suikou | ||
---|---|---|---|
行 90: | 行 90: | ||
EOF2 | EOF2 | ||
+ | exit | ||
+ | |||
``` | ``` | ||
行 102: | 行 104: | ||
Hello from Docker! と表示されればOK | Hello from Docker! と表示されればOK | ||
+ | |||
+ | 5..gz圧縮ファイルを解凍するソフトのインストール | ||
+ | |||
+ | NGSのデータ解析では普通にWindowsで使われる.zipの圧縮ではなく、.gz圧縮が用いられる。そのため、それを解凍することが出来るソフトウェアをインストールする。(例:Lhaplus https:// | ||
# Mac | # Mac | ||
行 231: | 行 237: | ||
``` | ``` | ||
で削除可能。 | で削除可能。 | ||
+ | |||
+ | ## Dockerfileからイメージのビルド | ||
+ | |||
+ | 上述のように、起動しているコンテナの中にツールをインストールするのではなく、予め決められた手順でイメージを新規作成することも可能である。 | ||
+ | その際にはDockerfileという名前のファイルを作成し、手順を記述する。 | ||
+ | |||
+ | 例えば、diamondという相同性検索ツールはBioContainersには登録されていないが、ツールの作者がDockerfileを作成してくれているため、簡単に自分でイメージを作成できる。 | ||
+ | 手順は下記の通り。 | ||
+ | |||
+ | ``` | ||
+ | git clone https:// | ||
+ | cd diamond | ||
+ | docker build -t diamond . | ||
+ | #-t の後はイメージの名前になるので、わかりやすい名前を付ける(今回はdiamond) | ||
+ | ``` | ||
+ | インストール後は、 | ||
+ | ``` | ||
+ | docker run -it --rm -v $PWD:$PWD -w $PWD diamond sh | ||
+ | ``` | ||
+ | で使用可能。 | ||
+ | |||
+ | 他にもDockerfileを配布しているツールは最近多い。 | ||
## スパコンや研究室のクラスターPCでの利用 | ## スパコンや研究室のクラスターPCでの利用 | ||
- | dockerは管理者権限(root権限)が必要になるため、共用のサーバでは使用することはできない。そのかわりsingularityというソフトウェアが使用可能である。 | + | dockerは管理者権限(root権限)が必要になるため、共用のサーバでは使用することはできない。そのかわりsingularityというソフトウェアが使用可能な場合がある。東大白金キャンパスのスパコンや、国立遺伝学研究所のスパコンではともにsingularityが使用可能である。 |
- | singularityは、DockerHubやQUAYなどに登録されているdockerの公開イメージを利用可能である。使用方法はサーバにログインして、下記のコマンドのように実行すれば良い。(研究室のサーバの場合は、「必ず」workフォルダに移動してから解析等を行うこと!) | + | singularityは、DockerHubやQUAYなどに登録されているdockerの公開イメージを利用可能である。使用方法はサーバにログインして、下記のコマンドのように実行すれば良い。(研究室のサーバの場合は、「必ず」workフォルダに移動してから解析等を行うこと!残念ながら2019年現在、WSL上ではsingularityのイメージ作成までは行えるが、コンテナの起動は出来ない。) |
まずはdockerの公開イメージからsingularityのイメージに変換する。下記の例は、BioContainersのbwaのイメージを使用する場合。 | まずはdockerの公開イメージからsingularityのイメージに変換する。下記の例は、BioContainersのbwaのイメージを使用する場合。 | ||
行 260: | 行 288: | ||
``` | ``` | ||
- | shopt -s expand_aliases # | + | shopt -s expand_aliases # |
- | alias bwa=' | + | alias bwa=' |
``` | ``` | ||
+ | # 次回以降 | ||
- | ## Dockerfileからイメージのビルド | + | 次回以降、それぞれ調査するツールのカテゴリを決めて(他の人と重なっても良い)、2週間に1つ以上ツールを調べて報告する。 |
+ | 調査2回目以降は、自分で過去に調べたツールの結果と何かしらの比較をすること。(計算時間、メモリー使用量、ディスク使用量、正確さ、感度などの中から興味のあるものについて) | ||
- | 上述のように、起動しているコンテナの中にツールをインストールするのではなく、予め決められた手順でイメージを新規作成することも可能である。 | + | 調べた結果を下記のWordpressのブログに記入する。言語は自由。お互いGoogle翻訳で何とかしましょう。 |
- | その際にはDockerfileという名前のファイルを作成し、手順を記述する。 | + | ただし、報告会で説明するときに見せる画面は英語にすること。(あらかじめ英語を併記するか、Google翻訳が自然な英語になるような日本語を書くなど工夫してください。) |
- | 例えば、diamondという相同性検索ツールはBioContainersには登録されていないが、ツールの作者がDockerfileを作成してくれているため、簡単に自分でイメージを作成できる。 | + | http:// |
- | 手順は下記の通り。 | + | |
- | ``` | + | ログインは下記のURLから、ID, |
- | git clone https:// | + | |
- | cd diamond | + | |
- | docker build -t diamond . | + | |
- | #-t の後はイメージの名前になるので、わかりやすい名前を付ける(今回はdiamond) | + | |
- | ``` | + | |
- | インストール後は、 | + | |
- | ``` | + | |
- | docker run -it --rm -v $PWD:$PWD -w $PWD diamond sh | + | |
- | ``` | + | |
- | で使用可能。 | + | |
- | 他にもDockerfileを配布しているツールは最近多い。 | + | http:// |
- | # 次回以降 | + | インストールしてほしいWordpressのプラグインがあれば、ご連絡ください。 |
- | 次回以降、それぞれ調査するツールのカテゴリを決めて(他の人と重なっても良い)、2週間に1つ以上ツールを調べて報告する。 | ||
- | 調査2回目以降は、自分で過去に調べたツールの結果と何かしらの比較をすること。(計算時間、メモリー使用量、ディスク使用量、正確さ、感度などの中から興味のあるものについて) | ||
- | 少なくともスライドは英語で作成すること。 | ||
カテゴリとツールの例 | カテゴリとツールの例 | ||
行 353: | 行 369: | ||
``` | ``` | ||
- | スライドは共有フォルダの | + | 下記は2年前のエンリッチメント解析ツールを調査したときに提出していただいたスライド一覧です。 |
+ | http:// | ||
+ | |||
+ | |||
+ | ## 練習 | ||
+ | |||
+ | 下記の配列はアコヤガイのとある遺伝子の予測された塩基配列です。 | ||
``` | ``` | ||
- | Slides and Reports/ | + | atgactctgaaggatgccctcaacaaaagtcacacaaatacaggaaacatgctcacaata |
+ | cttcaaagctttgaaaatcgtttaaagaagttagagggaacagttgagcctgtttacaat | ||
+ | gagacagaaatgctgcggcgcagacaagaaaatatagagaaaactatgacaacactggac | ||
+ | aatgtgctgggttactaccatattgctaaagatgtacaagatttgattaaagaaggtcca | ||
+ | gtagtttgtggtctggagaagtacctgtctactatggaccggctgctccaagcactgaac | ||
+ | tactttaataaacataacccaaccagtctggaagtgacagatgtcatcaaagtatatgat | ||
+ | gatggtaaagatacattgaatgcagagttccgtagtttacttggtcgtcactgtcgtccg | ||
+ | gtgccggctgttactatactggatttactaggaccagatgaagagttacaaacaatggaa | ||
+ | aatgatgcacccatagaacatctgcctgagaaaattgtgaatgatttaaccctcatcgca | ||
+ | aagtggctatacaccaatggtaaagctacagagtatatgaaagattacaccaaagtcagg | ||
+ | tcccaaatgctcctctactctctgcaggggaactcaataaagcggaaggctaccacggcc | ||
+ | ttgatgcagtccccttttgatccaggtcatagaagacaaggctcttataacgaattgaca | ||
+ | aaagaggaaagttttgatgttgaaattgatatctacataacagaactaacagcattgctg | ||
+ | aaacttattcagaatgaccctgagagatcttcgatgccccgagacggtacagttcatgaa | ||
+ | ctgacaaaccataccattatagtactggagcccctgttagattatgctgagacagctggg | ||
+ | gccatgttactcacccatggtgaacatgcagttccatctgatgctgtggatgtcaagaaa | ||
+ | agtaaactcaagttggctgactatatcactaaggttttgtcagcattaggattaaactta | ||
+ | agtaacaaggcagaaacttacagtgatccaatactcagacatgtgttcatgcttaataac | ||
+ | tatcactacatactcaagtctttaaaaaggtctggggtattagaattaattcacacatgg | ||
+ | aataaagatgtaggacagttttatgaggaccagatacatgaacaaaaaagactttattcc | ||
+ | cagagctggagtaaagttctacattttgtactggaaatgaatgagccaatatcccaacaa | ||
+ | agaatccagcaaatggagacatcaaagataaaggacaaagaaaagcagaatataaaagac | ||
+ | aagttctctggattcaacaaagagttggaagaaatctcacgtgttcagaaagcatacgcc | ||
+ | attcctgatccagaactgagggacaatatcaagaaagacaataaagaatatattgtgccg | ||
+ | cgatacaagcttttcttagaaaaatttcaacggctgaacttcacaaagaattcagaaaaa | ||
+ | tatatgaaatacactgtaaaggatgtggaagaaacacttgataaatttttcgatacttca | ||
+ | gcttaa | ||
``` | ``` | ||
- | に保存してください。 | ||
- | 下記は2年前のエンリッチメント解析ツールを調査したときに提出していただいたスライド一覧です。 | + | この配列は、近縁種であるカキのExocyst complex component 7と相同性がありますが、一部のExonが欠損しています。(遺伝子予測が間違っている。) |
- | http://www.suikou.fs.a.u-tokyo.ac.jp/document/ | + | それを調査してみましょう。 |
+ | 使用するのは、BLASTのblastxコマンドを使ってみてください。 | ||
+ | |||
+ | BLASTの使い方の説明:https:// | ||
+ | |||
+ | カキのExocyst complex component 7のアミノ酸配列 | ||
+ | ``` | ||
+ | > | ||
+ | MLTILQSFENRLRKLENTVEPVYNETEMLRRRQENIEKTMVTLDNVLGYYHVGKEVEEFIKEGPHNCGLE | ||
+ | KYLSIMDRLVQAHNYFNKHNPTSLELTDVIRVYDDGKEALVIEFRTLLGRHCRPVPPVMVLDMISTDEEL | ||
+ | QGSDDIQLEHLPEKILTELSLISTWLFNNTKNTEYMKDYTRSRSSMLIKSLQGHSFKRRAVITLMQSPFD | ||
+ | PGNKRQGSHAELPKEENLDVEVDIYITELSALLKLIQSEAQLMSGIIADKHHRSVFDNIIQEGLDSVIKN | ||
+ | GELLAVNAKKSIAKHDFINVLSVFPVLKHLRSIKPEFDLTLEGCATPTRAKLTSLLSTLGSTAAKALEEF | ||
+ | ALSIKTDPEKASMPKDGTVHELTNRTIIFLEPLQDYADTAGAMLLLHGEQAAPSEAVDPKKSKMRLADYI | ||
+ | TKTLSALGLNLTIKAETYSDPTLRPVFMLNNYHYILKSLKRSGLLDLIHTWNKDVGQFYEDRINEQKKLY | ||
+ | SESWSRVMHYITEVHEPISQQRIQAMENSKLKDKEKQNIKDKFSGFNKELEDILKIQKGYAIPDPELREQ | ||
+ | MKKDNKDFIIPAFRMFLDKFKRLNFTKNPEKYIKYSVQDVAEVVDKLFDMSA | ||
+ | ``` | ||
+ | |||
+ | さらに、下記のURLからアコヤガイのゲノムをダウンロードして、遺伝子予測で欠損しているExonはどのscaffoldに乗っているか調べてください。fasta.gzファイルを解凍するコマンドは```gzip -d ```です。 | ||
+ | |||
+ | https://marinegenomics.oist.jp/pearl/download/ | ||
+ | [[2019 blast練習回答例]] |