バイオインフォマティクス_ツールインストール方法_2019

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
バイオインフォマティクス_ツールインストール方法_2019 [2019/07/15 21:11] suikouバイオインフォマティクス_ツールインストール方法_2019 [2019/09/25 06:51] (現在) – [Mac] suikou
行 90: 行 90:
  
 EOF2 EOF2
 +exit
 + 
 ``` ```
  
行 102: 行 104:
  
 Hello from Docker! と表示されればOK Hello from Docker! と表示されればOK
 +
 +5..gz圧縮ファイルを解凍するソフトのインストール
 +
 +NGSのデータ解析では普通にWindowsで使われる.zipの圧縮ではなく、.gz圧縮が用いられる。そのため、それを解凍することが出来るソフトウェアをインストールする。(例:Lhaplus https://forest.watch.impress.co.jp/library/software/lhaplus/ 但し、Lhaplusは4GBを超えるようなZIPファイルには対応していないため、zipだけはWin標準の機能を使ったほうが良く、ツールインストール時にzipのチェックは外しておいたほうが良い。)
  
 # Mac # Mac
行 135: 行 141:
 /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)" /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
  
-echo "export PATH=/usr/local/opt/coreutils/libexec/gnubin:/usr/local/bin:/usr/local/sbin:${PATH} >> ~/.bash_profile"+echo 'export PATH=/usr/local/opt/coreutils/libexec/gnubin:/usr/local/bin:/usr/local/sbin:${PATH} 
 +export PATH=/usr/local/Cellar/grep/3.3/libexec/gnubin/:$PATH 
 +export PATH=/usr/local/Cellar/findutils/4.7.0/libexec/gnubin:$PATH' >> ~/.bash_profile
 source ~/.bash_profile source ~/.bash_profile
  
行 147: 行 155:
 ``` ```
 途中でMacのパスワードが聞かれるはずなので、入力する。 途中でMacのパスワードが聞かれるはずなので、入力する。
- 
  
 # Bioinformatics toolsのインストール # Bioinformatics toolsのインストール
行 253: 行 260:
  
 他にもDockerfileを配布しているツールは最近多い。 他にもDockerfileを配布しているツールは最近多い。
 +
 +## スパコンや研究室のクラスターPCでの利用
 +
 +dockerは管理者権限(root権限)が必要になるため、共用のサーバでは使用することはできない。そのかわりsingularityというソフトウェアが使用可能な場合がある。東大白金キャンパスのスパコンや、国立遺伝学研究所のスパコンではともにsingularityが使用可能である。
 +
 +singularityは、DockerHubやQUAYなどに登録されているdockerの公開イメージを利用可能である。使用方法はサーバにログインして、下記のコマンドのように実行すれば良い。(研究室のサーバの場合は、「必ず」workフォルダに移動してから解析等を行うこと!残念ながら2019年現在、WSL上ではsingularityのイメージ作成までは行えるが、コンテナの起動は出来ない。)
 +
 +まずはdockerの公開イメージからsingularityのイメージに変換する。下記の例は、BioContainersのbwaのイメージを使用する場合。
 +
 +```
 +singularity pull --name bwa.sif docker://quay.io/biocontainers/bwa:0.7.17--h84994c4_5
 +```
 +
 +bwa.sifというイメージが出来上がる。他のイメージを変換する場合は、```--nameで作成するイメージ名```と、```docker://の後のdockerのイメージのURL```を適当に変更する。
 +その後、次のコマンドでbwaのコンテナが起動するので、後はdockerと同じように使用すれば良い。
 +
 +```
 +singularity shell bwa.sif
 +```
 +
 +bwaだけ起動させたいときは、
 +
 +```
 +singularity exec bwa.sif bwa
 +```
 +
 +さらに、bwaと打てばsingularityの中のbwaが起動するようにするには、~/.bashrcに下記のようにエイリアスを追加すれば良い。
 +
 +```
 +shopt -s expand_aliases #バッチスクリプトの中でもbwaのエイリアスを有効にする。
 +alias bwa='singularity exec /suikou/files/m48/user2/work/img/bwa.sif bwa' #singularityのイメージは絶対パスで指定すること。
 +```
  
 # 次回以降 # 次回以降
行 258: 行 297:
 次回以降、それぞれ調査するツールのカテゴリを決めて(他の人と重なっても良い)、2週間に1つ以上ツールを調べて報告する。 次回以降、それぞれ調査するツールのカテゴリを決めて(他の人と重なっても良い)、2週間に1つ以上ツールを調べて報告する。
 調査2回目以降は、自分で過去に調べたツールの結果と何かしらの比較をすること。(計算時間、メモリー使用量、ディスク使用量、正確さ、感度などの中から興味のあるものについて) 調査2回目以降は、自分で過去に調べたツールの結果と何かしらの比較をすること。(計算時間、メモリー使用量、ディスク使用量、正確さ、感度などの中から興味のあるものについて)
-なくともスライドは英語で作成すること。+ 
 +調べた結果を下記のWordpressのブログに記入する。言語は自由。お互いGoogle翻訳で何とかしましょう。 
 +ただし、報告会で説明するときに見せる画面は英語にすること。(あらかじめ英語を併記するか、Google翻訳が自然英語になるような日本語を書など工夫してください。) 
 + 
 +http://www.suikou.fs.a.u-tokyo.ac.jp/blog/ 
 + 
 +ログンは下記のURLから、ID,パスワードは、研究室のサーバにログインするときと同じ。ただし、ログイン後にパスワードやメールアドレスは変更しておくこと。 
 + 
 +http://webpark1634.sakura.ne.jp/blog/wp-login.php 
 + 
 +インストールしてほしいWordpressのプラグインがあれば、ご連絡ください。 
  
 カテゴリとツールの例 カテゴリとツールの例
行 277: 行 327:
  全ゲノム nanopore→ゲノム: minimap2, minialign, last  全ゲノム nanopore→ゲノム: minimap2, minialign, last
  RNA-seq→ゲノム: tophat, hisat2, star  RNA-seq→ゲノム: tophat, hisat2, star
- cDNA→ゲノム: exonerate, GeneWise, gmap, spaln, minimap2+ cDNA→ゲノム: exonerate, GeneWise (https://www.ebi.ac.uk/~birney/wise2/), gmap, spaln, minimap2
  RNA-seq→cDNA: kallisto, RSEM, salmon  RNA-seq→cDNA: kallisto, RSEM, salmon
  rRNA→rRNA: blast, usearch  rRNA→rRNA: blast, usearch
行 320: 行 370:
 ``` ```
  
-スライドは共有フォルダ+下記は2年前のエンリッチメント解析ツールを調査したときに提出していただいたスライド一覧です。 
 +http://www.suikou.fs.a.u-tokyo.ac.jp/document/ 
 + 
 + 
 +## 練習 
 + 
 +下記の配列アコヤガイのとある遺伝子予測された塩基配列です。 
 ``` ```
-Slides and Reports/Study group/2019 Bioinformatics tools+atgactctgaaggatgccctcaacaaaagtcacacaaatacaggaaacatgctcacaata 
 +cttcaaagctttgaaaatcgtttaaagaagttagagggaacagttgagcctgtttacaat 
 +gagacagaaatgctgcggcgcagacaagaaaatatagagaaaactatgacaacactggac 
 +aatgtgctgggttactaccatattgctaaagatgtacaagatttgattaaagaaggtcca 
 +gtagtttgtggtctggagaagtacctgtctactatggaccggctgctccaagcactgaac 
 +tactttaataaacataacccaaccagtctggaagtgacagatgtcatcaaagtatatgat 
 +gatggtaaagatacattgaatgcagagttccgtagtttacttggtcgtcactgtcgtccg 
 +gtgccggctgttactatactggatttactaggaccagatgaagagttacaaacaatggaa 
 +aatgatgcacccatagaacatctgcctgagaaaattgtgaatgatttaaccctcatcgca 
 +aagtggctatacaccaatggtaaagctacagagtatatgaaagattacaccaaagtcagg 
 +tcccaaatgctcctctactctctgcaggggaactcaataaagcggaaggctaccacggcc 
 +ttgatgcagtccccttttgatccaggtcatagaagacaaggctcttataacgaattgaca 
 +aaagaggaaagttttgatgttgaaattgatatctacataacagaactaacagcattgctg 
 +aaacttattcagaatgaccctgagagatcttcgatgccccgagacggtacagttcatgaa 
 +ctgacaaaccataccattatagtactggagcccctgttagattatgctgagacagctggg 
 +gccatgttactcacccatggtgaacatgcagttccatctgatgctgtggatgtcaagaaa 
 +agtaaactcaagttggctgactatatcactaaggttttgtcagcattaggattaaactta 
 +agtaacaaggcagaaacttacagtgatccaatactcagacatgtgttcatgcttaataac 
 +tatcactacatactcaagtctttaaaaaggtctggggtattagaattaattcacacatgg 
 +aataaagatgtaggacagttttatgaggaccagatacatgaacaaaaaagactttattcc 
 +cagagctggagtaaagttctacattttgtactggaaatgaatgagccaatatcccaacaa 
 +agaatccagcaaatggagacatcaaagataaaggacaaagaaaagcagaatataaaagac 
 +aagttctctggattcaacaaagagttggaagaaatctcacgtgttcagaaagcatacgcc 
 +attcctgatccagaactgagggacaatatcaagaaagacaataaagaatatattgtgccg 
 +cgatacaagcttttcttagaaaaatttcaacggctgaacttcacaaagaattcagaaaaa 
 +tatatgaaatacactgtaaaggatgtggaagaaacacttgataaatttttcgatacttca 
 +gcttaa
 ``` ```
-に保存してください。 
  
-下記2年前エンリッチメント解析ツールを調査したとき提出していだいたスライド一覧です。 +この配列、近縁種であるカキExocyst complex component 7と相同性がありますが、一部のExonが欠損しています。(遺伝子予測が間違っている。) 
-http://www.suikou.fs.a.u-tokyo.ac.jp/document/+それを調査してみましょう。 
 +使用するのは、BLASTのblastxコマンドを使ってみてください。 
 + 
 +BLASTの使い方の説明:https://togotv.dbcls.jp/20170606.html 
 + 
 +カキのExocyst complex component 7のアミノ酸配列 
 +``` 
 +>EKC30356.1 Exocyst complex component 7 [Crassostrea gigas] 
 +MLTILQSFENRLRKLENTVEPVYNETEMLRRRQENIEKTMVTLDNVLGYYHVGKEVEEFIKEGPHNCGLE 
 +KYLSIMDRLVQAHNYFNKHNPTSLELTDVIRVYDDGKEALVIEFRTLLGRHCRPVPPVMVLDMISTDEEL 
 +QGSDDIQLEHLPEKILTELSLISTWLFNNTKNTEYMKDYTRSRSSMLIKSLQGHSFKRRAVITLMQSPFD 
 +PGNKRQGSHAELPKEENLDVEVDIYITELSALLKLIQSEAQLMSGIIADKHHRSVFDNIIQEGLDSVIKN 
 +GELLAVNAKKSIAKHDFINVLSVFPVLKHLRSIKPEFDLTLEGCATPTRAKLTSLLSTLGSTAAKALEEF 
 +ALSIKTDPEKASMPKDGTVHELTNRTIIFLEPLQDYADTAGAMLLLHGEQAAPSEAVDPKKSKMRLADYI 
 +TKTLSALGLNLTIKAETYSDPTLRPVFMLNNYHYILKSLKRSGLLDLIHTWNKDVGQFYEDRINEQKKLY 
 +SESWSRVMHYITEVHEPISQQRIQAMENSKLKDKEKQNIKDKFSGFNKELEDILKIQKGYAIPDPELREQ 
 +MKKDNKDFIIPAFRMFLDKFKRLNFTKNPEKYIKYSVQDVAEVVDKLFDMSA 
 +``` 
 + 
 +さら、下記のURLからアコヤガイのゲノムをダウンロードして、遺伝子予測で欠損しているExonはどのscaffoldに乗っているか調べてく。fasta.gzファルを解凍するコマンは```gzip -d ```です。 
 + 
 +https://marinegenomics.oist.jp/pearl/download/pfu_genome1.0.fasta.gz
  
 +[[2019 blast練習回答例]]
  • バイオインフォマティクス_ツールインストール方法_2019.1563225086.txt.gz
  • 最終更新: 2019/07/15 21:11
  • by suikou