差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
バイオインフォマティクス_ツールインストール方法_2019 [2019/07/15 21:11] – suikou | バイオインフォマティクス_ツールインストール方法_2019 [2019/09/25 06:51] (現在) – [Mac] suikou | ||
---|---|---|---|
行 90: | 行 90: | ||
EOF2 | EOF2 | ||
+ | exit | ||
+ | |||
``` | ``` | ||
行 102: | 行 104: | ||
Hello from Docker! と表示されればOK | Hello from Docker! と表示されればOK | ||
+ | |||
+ | 5..gz圧縮ファイルを解凍するソフトのインストール | ||
+ | |||
+ | NGSのデータ解析では普通にWindowsで使われる.zipの圧縮ではなく、.gz圧縮が用いられる。そのため、それを解凍することが出来るソフトウェアをインストールする。(例:Lhaplus https:// | ||
# Mac | # Mac | ||
行 135: | 行 141: | ||
/ | / | ||
- | echo "export PATH=/ | + | echo 'export PATH=/ |
+ | export PATH=/ | ||
+ | export PATH=/ | ||
source ~/ | source ~/ | ||
行 147: | 行 155: | ||
``` | ``` | ||
途中でMacのパスワードが聞かれるはずなので、入力する。 | 途中でMacのパスワードが聞かれるはずなので、入力する。 | ||
- | |||
# Bioinformatics toolsのインストール | # Bioinformatics toolsのインストール | ||
行 253: | 行 260: | ||
他にもDockerfileを配布しているツールは最近多い。 | 他にもDockerfileを配布しているツールは最近多い。 | ||
+ | |||
+ | ## スパコンや研究室のクラスターPCでの利用 | ||
+ | |||
+ | dockerは管理者権限(root権限)が必要になるため、共用のサーバでは使用することはできない。そのかわりsingularityというソフトウェアが使用可能な場合がある。東大白金キャンパスのスパコンや、国立遺伝学研究所のスパコンではともにsingularityが使用可能である。 | ||
+ | |||
+ | singularityは、DockerHubやQUAYなどに登録されているdockerの公開イメージを利用可能である。使用方法はサーバにログインして、下記のコマンドのように実行すれば良い。(研究室のサーバの場合は、「必ず」workフォルダに移動してから解析等を行うこと!残念ながら2019年現在、WSL上ではsingularityのイメージ作成までは行えるが、コンテナの起動は出来ない。) | ||
+ | |||
+ | まずはdockerの公開イメージからsingularityのイメージに変換する。下記の例は、BioContainersのbwaのイメージを使用する場合。 | ||
+ | |||
+ | ``` | ||
+ | singularity pull --name bwa.sif docker:// | ||
+ | ``` | ||
+ | |||
+ | bwa.sifというイメージが出来上がる。他のイメージを変換する場合は、```--nameで作成するイメージ名```と、```docker:// | ||
+ | その後、次のコマンドでbwaのコンテナが起動するので、後はdockerと同じように使用すれば良い。 | ||
+ | |||
+ | ``` | ||
+ | singularity shell bwa.sif | ||
+ | ``` | ||
+ | |||
+ | bwaだけ起動させたいときは、 | ||
+ | |||
+ | ``` | ||
+ | singularity exec bwa.sif bwa | ||
+ | ``` | ||
+ | |||
+ | さらに、bwaと打てばsingularityの中のbwaが起動するようにするには、~/ | ||
+ | |||
+ | ``` | ||
+ | shopt -s expand_aliases # | ||
+ | alias bwa=' | ||
+ | ``` | ||
# 次回以降 | # 次回以降 | ||
行 258: | 行 297: | ||
次回以降、それぞれ調査するツールのカテゴリを決めて(他の人と重なっても良い)、2週間に1つ以上ツールを調べて報告する。 | 次回以降、それぞれ調査するツールのカテゴリを決めて(他の人と重なっても良い)、2週間に1つ以上ツールを調べて報告する。 | ||
調査2回目以降は、自分で過去に調べたツールの結果と何かしらの比較をすること。(計算時間、メモリー使用量、ディスク使用量、正確さ、感度などの中から興味のあるものについて) | 調査2回目以降は、自分で過去に調べたツールの結果と何かしらの比較をすること。(計算時間、メモリー使用量、ディスク使用量、正確さ、感度などの中から興味のあるものについて) | ||
- | 少なくともスライドは英語で作成すること。 | + | |
+ | 調べた結果を下記のWordpressのブログに記入する。言語は自由。お互いGoogle翻訳で何とかしましょう。 | ||
+ | ただし、報告会で説明するときに見せる画面は英語にすること。(あらかじめ英語を併記するか、Google翻訳が自然な英語になるような日本語を書くなど工夫してください。) | ||
+ | |||
+ | http:// | ||
+ | |||
+ | ログインは下記のURLから、ID, | ||
+ | |||
+ | http:// | ||
+ | |||
+ | インストールしてほしいWordpressのプラグインがあれば、ご連絡ください。 | ||
カテゴリとツールの例 | カテゴリとツールの例 | ||
行 277: | 行 327: | ||
全ゲノム nanopore→ゲノム: | 全ゲノム nanopore→ゲノム: | ||
RNA-seq→ゲノム: | RNA-seq→ゲノム: | ||
- | cDNA→ゲノム: | + | cDNA→ゲノム: |
RNA-seq→cDNA: | RNA-seq→cDNA: | ||
rRNA→rRNA: | rRNA→rRNA: | ||
行 320: | 行 370: | ||
``` | ``` | ||
- | スライドは共有フォルダの | + | 下記は2年前のエンリッチメント解析ツールを調査したときに提出していただいたスライド一覧です。 |
+ | http:// | ||
+ | |||
+ | |||
+ | ## 練習 | ||
+ | |||
+ | 下記の配列はアコヤガイのとある遺伝子の予測された塩基配列です。 | ||
``` | ``` | ||
- | Slides and Reports/ | + | atgactctgaaggatgccctcaacaaaagtcacacaaatacaggaaacatgctcacaata |
+ | cttcaaagctttgaaaatcgtttaaagaagttagagggaacagttgagcctgtttacaat | ||
+ | gagacagaaatgctgcggcgcagacaagaaaatatagagaaaactatgacaacactggac | ||
+ | aatgtgctgggttactaccatattgctaaagatgtacaagatttgattaaagaaggtcca | ||
+ | gtagtttgtggtctggagaagtacctgtctactatggaccggctgctccaagcactgaac | ||
+ | tactttaataaacataacccaaccagtctggaagtgacagatgtcatcaaagtatatgat | ||
+ | gatggtaaagatacattgaatgcagagttccgtagtttacttggtcgtcactgtcgtccg | ||
+ | gtgccggctgttactatactggatttactaggaccagatgaagagttacaaacaatggaa | ||
+ | aatgatgcacccatagaacatctgcctgagaaaattgtgaatgatttaaccctcatcgca | ||
+ | aagtggctatacaccaatggtaaagctacagagtatatgaaagattacaccaaagtcagg | ||
+ | tcccaaatgctcctctactctctgcaggggaactcaataaagcggaaggctaccacggcc | ||
+ | ttgatgcagtccccttttgatccaggtcatagaagacaaggctcttataacgaattgaca | ||
+ | aaagaggaaagttttgatgttgaaattgatatctacataacagaactaacagcattgctg | ||
+ | aaacttattcagaatgaccctgagagatcttcgatgccccgagacggtacagttcatgaa | ||
+ | ctgacaaaccataccattatagtactggagcccctgttagattatgctgagacagctggg | ||
+ | gccatgttactcacccatggtgaacatgcagttccatctgatgctgtggatgtcaagaaa | ||
+ | agtaaactcaagttggctgactatatcactaaggttttgtcagcattaggattaaactta | ||
+ | agtaacaaggcagaaacttacagtgatccaatactcagacatgtgttcatgcttaataac | ||
+ | tatcactacatactcaagtctttaaaaaggtctggggtattagaattaattcacacatgg | ||
+ | aataaagatgtaggacagttttatgaggaccagatacatgaacaaaaaagactttattcc | ||
+ | cagagctggagtaaagttctacattttgtactggaaatgaatgagccaatatcccaacaa | ||
+ | agaatccagcaaatggagacatcaaagataaaggacaaagaaaagcagaatataaaagac | ||
+ | aagttctctggattcaacaaagagttggaagaaatctcacgtgttcagaaagcatacgcc | ||
+ | attcctgatccagaactgagggacaatatcaagaaagacaataaagaatatattgtgccg | ||
+ | cgatacaagcttttcttagaaaaatttcaacggctgaacttcacaaagaattcagaaaaa | ||
+ | tatatgaaatacactgtaaaggatgtggaagaaacacttgataaatttttcgatacttca | ||
+ | gcttaa | ||
``` | ``` | ||
- | に保存してください。 | ||
- | 下記は2年前のエンリッチメント解析ツールを調査したときに提出していただいたスライド一覧です。 | + | この配列は、近縁種であるカキのExocyst complex component 7と相同性がありますが、一部のExonが欠損しています。(遺伝子予測が間違っている。) |
- | http://www.suikou.fs.a.u-tokyo.ac.jp/document/ | + | それを調査してみましょう。 |
+ | 使用するのは、BLASTのblastxコマンドを使ってみてください。 | ||
+ | |||
+ | BLASTの使い方の説明:https:// | ||
+ | |||
+ | カキのExocyst complex component 7のアミノ酸配列 | ||
+ | ``` | ||
+ | > | ||
+ | MLTILQSFENRLRKLENTVEPVYNETEMLRRRQENIEKTMVTLDNVLGYYHVGKEVEEFIKEGPHNCGLE | ||
+ | KYLSIMDRLVQAHNYFNKHNPTSLELTDVIRVYDDGKEALVIEFRTLLGRHCRPVPPVMVLDMISTDEEL | ||
+ | QGSDDIQLEHLPEKILTELSLISTWLFNNTKNTEYMKDYTRSRSSMLIKSLQGHSFKRRAVITLMQSPFD | ||
+ | PGNKRQGSHAELPKEENLDVEVDIYITELSALLKLIQSEAQLMSGIIADKHHRSVFDNIIQEGLDSVIKN | ||
+ | GELLAVNAKKSIAKHDFINVLSVFPVLKHLRSIKPEFDLTLEGCATPTRAKLTSLLSTLGSTAAKALEEF | ||
+ | ALSIKTDPEKASMPKDGTVHELTNRTIIFLEPLQDYADTAGAMLLLHGEQAAPSEAVDPKKSKMRLADYI | ||
+ | TKTLSALGLNLTIKAETYSDPTLRPVFMLNNYHYILKSLKRSGLLDLIHTWNKDVGQFYEDRINEQKKLY | ||
+ | SESWSRVMHYITEVHEPISQQRIQAMENSKLKDKEKQNIKDKFSGFNKELEDILKIQKGYAIPDPELREQ | ||
+ | MKKDNKDFIIPAFRMFLDKFKRLNFTKNPEKYIKYSVQDVAEVVDKLFDMSA | ||
+ | ``` | ||
+ | |||
+ | さらに、下記のURLからアコヤガイのゲノムをダウンロードして、遺伝子予測で欠損しているExonはどのscaffoldに乗っているか調べてください。fasta.gzファイルを解凍するコマンドは```gzip -d ```です。 | ||
+ | |||
+ | https://marinegenomics.oist.jp/pearl/download/ | ||
+ | [[2019 blast練習回答例]] |