clcの使い方

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
clcの使い方 [2021/04/19 10:59] – [CLCの使い方] 118.240.79.152clcの使い方 [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1
行 1: 行 1:
-# CLCの使い方 
- 
-1.m1536.sもしくはm768c.sにリモートデスクトップ接続でログインします。(次の接続方法参照 [[http://www.suikou.fs.a.u-tokyo.ac.jp/dokuwiki/doku.php?id=linux%E5%88%A9%E7%94%A8%E6%96%B9%E6%B3%95win#%E3%83%AA%E3%83%A2%E3%83%BC%E3%83%88%E3%83%87%E3%82%B9%E3%82%AF%E3%83%88%E3%83%83%E3%83%97%E6%8E%A5%E7%B6%9A%E3%82%92%E7%94%A8%E3%81%84%E3%81%9Flinux%E3%82%B5%E3%83%BC%E3%83%90%E3%81%B8%E3%81%AE%E6%8E%A5%E7%B6%9A|Windows]], [[http://www.suikou.fs.a.u-tokyo.ac.jp/dokuwiki/doku.php?id=linux%E5%88%A9%E7%94%A8%E6%96%B9%E6%B3%95mac#remote_desktop%E3%82%92%E7%94%A8%E3%81%84%E3%81%9Flinux%E3%82%B5%E3%83%BC%E3%83%90%E3%81%B8%E3%81%AE%E6%8E%A5%E7%B6%9A|Mac]] ) 
- 
-2.デスクトップにある「CLC for m1536」もしくは「CLC for m768c」というアイコンをダブルクリックします。 
- 
-{{:pasted:20210419-182258.png}} 
- 
-3.いくつかライセンスの切れたプラグインの警告が出たり、ライセンスのない最新版へバージョンアップするかなどのダイアログが出ますが、すべてスキップしてください。 
- 
-{{:pasted:20210419-182438.png}} 
- 
-4.今回は例としてバクテリアゲノムのIlluminaシーケンスデータをアセンブルしてみたいと思います。真核生物でも同じ手順です。通常はデータは手元にあると思いますが、今回はFirefoxというウェブブラウザを起動して公開されているシーケンスデータを探しに行きます。 
-{{:pasted:20210419-182819.png}} 
- 
-余談ですが、以前Firefoxを起動したときにクラッシュしたなどが原因で、他のFirefoxが起動しているため起動できないというエラーが出た場合は、「アプリケーション」→「ターミナルエミュレータ」を起動して、下記のコマンドを入力すれば手っ取り早くFirefoxが起動できるようになります。ただし、Firefoxの履歴などは全部消えます。 
- 
-``` 
-rm -rf ~/.mozilla/firefox 
-``` 
- 
-5.FirefoxでDDBJのDRASearchというサイトを開く。https://ddbj.nig.ac.jp/DRASearch/ 
- 
-6.例えば、Organism: Escherichia coli(大腸菌), StudyType: Whole Genome Sequencing, Platform: Illuminaを指定して検索してみる。 
- 
-{{:pasted:20210419-183707.png}} 
- 
-7.検索結果の中のDRP001687などをクリックすると、各プロジェクトの詳細を見ることができ、右のほうにFASTQファイルのリンクがある。 
- 
-{{:pasted:20210419-184317.png}} 
- 
-8.FASTQをダウンロードしようとすると、ファイルを保存するかどうか聞かれるので、「ファイルを保存する」を選択してOKを押す。2021年4月はちょうどFTPプロトコルが廃止されたばかりで、たぶん手元のPCのChromeなどでFASTQをダウンロードしようとしてもChromeやEdgeではダウンロードできない。いずれFTPではなくHTTPにDDBJ側が移行すると思われるけど、今はサーバにインストールされている古いFirefoxを使うほうが無難。Firefoxも近い将来FTPを廃止する予定。 
- 
-{{:pasted:20210419-184639.png}} 
- 
-保存先は出来れば、ホームフォルダの下の「work」フォルダにしてほしい。研究室のサーバではホームフォルダはm32sというサーバのホームフォルダを共有しているけど、「work」フォルダは各サーバに固有の(通常大容量の)「/data」フォルダにリンクされているので、共有のホームフォルダを消費しないで済む。 
- 
-{{:pasted:20210419-185111.png}} 
- 
-Forward reads (```_1.fastq```)と、Reverse reads (```_2.fastq```)を両方ダウンロードする。Illuminaは通常ペアエンドでシーケンスされる。Nanoporeなど別のシーケンサーによっては一つだけの場合もあるし、Illuminaでもシングルエンドだけ読む場合もある。 
- 
-9.CLC Genomics Workbenchを開いて、「Import」→「Illumina」を選択する。CLCはgzip, bzip2圧縮に対応しているので、ダウンロードしたファイルをそのままインポート可能。 
- 
-{{:pasted:20210419-185450.png}} 
- 
-10.先ほどダウンロードした2つのファイルを選択し、ペアエンドであれば「Paired reads」にチェックを入れる。ペアリード間の距離を入力する必要があるが、通常200 - 800 bp程度なので、その程度の値を書いておけば十分。アセンブル時にscaffoldingするステップで多少Nの長さに影響するが、あまり気にしなくても良いと思う。 
- 
-{{:pasted:20210419-190253.png}} 
- 
-11.あとは適当にNextを押しておけばよい。 
- 
-{{:pasted:20210419-190327.png}} 
- 
-12.新しいフォルダーを作っておいて、そこに保存したほうが後々わかりやすいかも。選んだら「Finish」を押す。 
- 
-{{:pasted:20210419-190432.png}} 
- 
-13. 
- 
-14. 
- 
-15. 
- 
-16. 
- 
- 
-# OS入れ替え前の古いファイルを見たい場合 
- 
-m1536.s, m768.sにログインするときに、 
- 
-ID: suikou 
- 
-パスワード: suikou 
- 
-でログインしてください。 
- 
-このユーザで「CLC for m1536」もしくは「CLC for m768c」を実行すると、古いデータが見えます。 
- 
  
  • clcの使い方.1618829981.txt.gz
  • 最終更新: 2021/04/19 10:59
  • by 118.240.79.152