2020-魚種判別・系統解析

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
2020-魚種判別・系統解析 [2020/10/24 17:09] suikou2020-魚種判別・系統解析 [2020/10/29 15:52] (現在) suikou
行 1: 行 1:
 # rRNA配列を用いた魚種判別、系統樹解析 # rRNA配列を用いた魚種判別、系統樹解析
  
-サンガーシーケンスのデータを開いて、データベースで相同性検索を行い、肉片の魚種を推定する。またシーケンスした配列を含めた系統樹を作成する。+サンガーシーケンスのデータを開いて、データベースで相同性検索を行い、肉片の魚種を推定する。さらにシーケンスした配列を含めた魚類の系統樹を作成する。 
 + 
 +使用した切り身の写真 
 +|サンプル1,10 {{:pasted:20201027-124734.png?200}}|サンプル2,8 {{:pasted:20201027-124837.png?200}}|サンプル 3,12 {{:pasted:20201027-124856.png?200}}| 
 +|サンプル4,13 {{:pasted:20201027-124918.png?200}}|サンプル5,19 {{:pasted:20201027-124936.png?150}}|サンプル6,14 {{:pasted:20201027-124954.png?200}}| 
 +|サンプル7,20 {{:pasted:20201027-125013.png?100}}|サンプル9,16 {{:pasted:20201027-125040.png?200}}|サンプル11 {{:pasted:20201027-125054.png?200}}| 
 +|サンプル15,18 {{:pasted:20201027-125115.png?200}}| 
 + 
 +サンガーシーケンスの結果 
 +http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2020jissyu/2020sanger.zip
  
 ## A. 使用するコンピュータについて ## A. 使用するコンピュータについて
  
-今回行う解析はメモリ8GB以上、HDDの空き容量が50GBあるPCであれば十分です。もし十分なスペックのPCが手元にあれば、自分のPCで解析することを推奨します。もし十分なスペックがない場合は、水圏生物工学研究室のPCを遠隔で使用することが可能です。+今回行う解析はメモリ8GB以上、HDDの空き容量が50GBあるPCであれば十分です。もし十分なスペックのPCが手元にあれば、自分のPCで解析することを推奨します。 
 + 
 +もし十分なスペックがない場合は、水圏生物工学研究室のPCを遠隔で使用することが可能です。
  
 下記の4つのいずれかの環境を選択し、それぞれ事前準備を進めてください。 下記の4つのいずれかの環境を選択し、それぞれ事前準備を進めてください。
行 37: 行 48:
 {{:pasted:20201015-161501.png}} {{:pasted:20201015-161501.png}}
  
-5.デスプにある「端末」アイコンをダブルクリックしてターミナルを開きます。+5.ターミナルを開くために、画面下のタイル状のアイコンをクし、「ユーティリティ」→「端末」アイコンをダブルクリックしてターミナルを開きます。場所は多少違うことが有ります。
  
-{{:pasted:20201015-161751.png}}+{{:pasted:20201027-175705.png}}
  
 6.ダウンロードしたGeneiousのインストーラを実行するために下記のコマンドを入力します。 6.ダウンロードしたGeneiousのインストーラを実行するために下記のコマンドを入力します。
行 74: 行 85:
 {{:pasted:20201015-162704.png}} {{:pasted:20201015-162704.png}}
  
-8.Geneiousを起動します。ターミナル上で次のコマンドを入力してください+8.Geneiousを起動します。
  
-``` +{{:pasted:20201027-180126.png}}
-/home/training/Geneious_Prime/Geneious\ Prime +
-``` +
- +
-{{:pasted:20201015-163118.png}}+
  
 9.「Trial Later」をクリックします。 9.「Trial Later」をクリックします。
行 88: 行 95:
 ## C. データベースで相同性検索を行う ## C. データベースで相同性検索を行う
  
-1.下記のzipデータをダウンロードし、アーカイブマネージャーで開いて、「展開」をクリックし、適当な場所にファイルを解凍する。(現在のデータ。XXX.ab1を使えば良い。)+1.下記のzipデータをダウンロードし、アーカイブマネージャーで開いて、「展開」をクリックし、適当な場所にファイルを解凍する。とりあえず使うの各自担当したサンプルフォワードとリバースのシーケンスデータ。
  
-http://www.suikou.fs.a.u-tokyo.ac.jp/yosh/lib/exe/fetch.php?media=409495_11300805066_all.zip+http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2020jissyu/2020sanger.zip
  
 {{:pasted:20201020-154035.png}} {{:pasted:20201020-154035.png}}
  
-2.Geneiousでシーケンスファイルを開く。「Sources」をLocalなど適当な場所を選択しておいて、「File」→「Import」→「Frome File...」をクリックし、先ほど解凍したシーケンスファイルを選択して、「Import」をクリックする。+2.Geneiousでシーケンスファイルを開く。「Sources」をLocalなど適当な場所を選択しておいて、「File」→「Import」→「From File...」をクリックし、先ほど解凍したシーケンスファイルを選択して、「Import」をクリックする。
  
 {{:pasted:20201020-154531.png}} {{:pasted:20201020-154531.png}}
行 102: 行 109:
 {{:pasted:20201020-155035.png}} {{:pasted:20201020-155035.png}}
  
-4.シーケンス結果から塩基配列を取得するには、「Text View」を開いて、読めていそうな範囲を選択し、配列を「Copy」する。数字もコピーされてしまうが、この後実行するBlast検索では塩基配列以外の文字列は削除され影響が無いのでそのまま進む+4.綺麗に読めた部分だけ抜き出して、別ファイルに保存する。まずは綺麗に読めた部分ドラッグ&ドロップで選択し、右クリックしてコピーを選択する。
  
-{{:pasted:20201020-155942.png}}+{{:pasted:20201027-181254.png}}
  
-5.下記のNCBI BLASTのページを開いて、「nucleotide -> nucleotide」(通称blastn)を開いて、コピーした配列をクエリーに張り付ける。Databaseにnr/ntが選択されていることを確認して、BLASTをクリックする。nr/ntはGenbankに登録された配列の冗長さを除去した(non-redundantな)データベースで、幅広い生物種・遺伝子が網羅的にバランスよく登録されていて、まずはここで配列を検索する研究者が多い。+5.リストの適当なところで右クリックして、Pasteを押す。 
 + 
 +{{:pasted:20201027-181608.png}} 
 + 
 +6.フォワードとリバースで抜きだした配列を選択し、アライメントを実行する。 
 + 
 +{{:pasted:20201027-181916.png}} 
 + 
 +7.自動で配列の向きを合わせてくれるように「Automatically determine direction (slower)」にチェックを入れておく。 
 + 
 +{{:pasted:20201027-182029.png}} 
 + 
 +8.Consensus配列をドラッグ&ドロップで選択し、右クリックしてCopyする。 
 + 
 +{{:pasted:20201027-182252.png}} 
 + 
 +9.下記のNCBI BLASTのページを開いて、「nucleotide -> nucleotide」(通称blastn)を開いて、コピーした配列をクエリーに張り付ける。Databaseにnr/ntが選択されていることを確認して、BLASTをクリックする。nr/ntはGenbankに登録された配列の冗長さを除去した(non-redundantな)データベースで、幅広い生物種・遺伝子が網羅的にバランスよく登録されていて、まずはここで配列を検索する研究者が多い。
  
 https://blast.ncbi.nlm.nih.gov/Blast.cgi https://blast.ncbi.nlm.nih.gov/Blast.cgi
行 112: 行 135:
 {{:pasted:20201020-160022.png}} {{:pasted:20201020-160022.png}}
  
-6.そのほか、魚類のミトコンドリア専用のデータベースとして、東大岩崎研で維持されているMitoFishデータベースがある。+10.そのほか、魚類のミトコンドリア専用のデータベースとして、東大岩崎研でメンテナンスされているMitoFishデータベースがある。
  
 http://mitofish.aori.u-tokyo.ac.jp/ http://mitofish.aori.u-tokyo.ac.jp/
  
-こちらは2020年10月現在、2,939種の魚の完全長のミトコンドリアが登録されている。NCBI NTデータベースと、MitoFishデータベース両方で検索して違いを比較する。+こちらは2020年10月現在、2,939種の魚の完全長のミトコンドリアが登録されている。NCBI NTデータベースと、MitoFishデータベース両方で検索して違いを比較してみる。 
 + 
 +11.ミトコンドリアの配列をデータベースからダウンロードし、シーケンスデータとアライメントを行い、シーケンスした領域がどこだったのか確認する。
  
-7.ミトコンドリアの配列と、シーケンスデータのアライメント。NCBI、MitoFishどちらも結果を適当にクリックしていると、ヒットした配列のAccession番号のリンクを見つけることが出来るはず。Accession番号を開くと、Genbankに登録されている配列を直接表示することが可能である。+NCBI、MitoFishどちらも結果を適当にクリックしていると、ヒットした配列のAccession番号のリンクを見つけることが出来るはず。Accession番号を開くと、GenBankに登録されている配列をアノテーション付きで表示することが可能である。
  
 {{:pasted:20201020-161521.png}} {{:pasted:20201020-161521.png}}
  
-8.シーケンスデータと相同性のある完全長ミトコンドリアの配列をGenbankから探し、GenBank形式でファイルに保存するを選んでダウンロードする。+12.シーケンスデータと相同性のある完全長ミトコンドリアの配列をGenBankで開き、GenBank形式でファイルに保存するを選んでダウンロードする。
  
 {{:pasted:20201020-161800.png}} {{:pasted:20201020-161800.png}}
  
-9.Geneiousで「File」→「Import」→「Frome File...」をクリックし、先ほどダウンロードしたGenBankファイルを開く。+13.Geneiousで「File」→「Import」→「From File...」をクリックし、先ほどダウンロードしたGenBankファイルを開く。
  
-10.シーケンスデータと、インポートしたGenBankファイルを選択し、「Align/Assemble」→「Pairwise Align...」をクリックする。+14.シーケンスデータと、インポートしたGenBankファイルを選択し、「Align/Assemble」→「Multiple Align...」をクリックする。「Automatically determine direction (slower)」にチェックを入れて「OK」を押す
  
-{{:pasted:20201020-162300.png}}+{{:pasted:20201027-182953.png}}
  
-11.無料版だと、アライメントで高速なMUSCLEなどの外部プログラムが実行できないので、Geneious Alignmentを使用する。Geneious Alignmentには自動で配列の向きを揃えてくれる機能があるので便利。「Automatically determine direction (slower)」にチェックを入れて「OK」を押す。 +15.Alignment ViewでCtrl+Fを押すと、配列を検索する画面が開くので、下記のプライマーの配列を張り付けて検索してみる。もしヒットしない場合は、プライマーの配列が保存されていない可能性もあるため、適当に検索する配列を短くしてヒットするかどうかを見ていく。ヒットする配列は基本的には16S rRNAの中にあるはずである。
- +
-12.Alignment ViewでCtrl+Fを押すと、配列を検索する画面が開くので、下記のプライマーの配列を張り付けて検索してみる。もしヒットしない場合は、プライマーの配列が保存されていない可能性もあるため、適当に検索する配列を短くしてヒットするかどうかを見ていく。ヒットする配列は基本的には16S rRNAの中にあるはずである。+
  
 ``` ```
行 143: 行 166:
 {{:pasted:20201020-163456.png}} {{:pasted:20201020-163456.png}}
  
-13.プライマーの配列から何塩基くらい離れたところからシーケンスが開始されているか、シーケンスデータとリファレンス配列が不一致な場所があれば、波形が綺麗に読まれているかどうかを確認する。+16.プライマーの配列から何塩基くらい離れたところからシーケンスが開始されているか、シーケンスデータとリファレンス配列が不一致な場所があれば、波形が綺麗に読まれているかどうかを確認する。 
 + 
 +自分の担当したサンプル番号の魚を上の切り身の写真と、配列の検索結果から推定し、Zoomのチャットに書き込む
  
 ## D. 系統樹作成 ## D. 系統樹作成
行 151: 行 176:
 1.下記のファイルには46種の生物のミトコンドリア16S rRNA配列が含まれているのでダウンロードする。 1.下記のファイルには46種の生物のミトコンドリア16S rRNA配列が含まれているのでダウンロードする。
  
-http://www.suikou.fs.a.u-tokyo.ac.jp/yosh/lib/exe/fetch.php?media=16s.zip+http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2020jissyu/16S-46sp.fasta.zip
  
-2.Geneiousの「File」→「Import」→「Frome File...」からダウンロードしたファイルを開く。その際、「Nucleotide sequences」→「Keep sequences separate」を選んでおく。+2.Geneiousの「File」→「Import」→「From File...」からダウンロードしたファイルを開く。その際、「Nucleotide sequences」→「Keep sequences separate」を選んでおく。
  
-3.開いた配列を全て選択して、「Align/Assemble」→「Pairwise Align...」をクリックし、マルチプルアライメントを作成する。(しばらく時間がかかる。)+3.開いた配列を全て選択して、「Align/Assemble」→「Multiple Align...」をクリックし、マルチプルアライメントを作成する。(しばらく時間がかかる。)
  
 4.マルチプルアライメント結果を選択した状態で、「Tree」をクリックし、UPGMAによる系統樹を作成する。その際各分岐の確からしさをブートストラップ法によって求めるため、「Resample tree」にチェックを入れて「OK」を押す。 4.マルチプルアライメント結果を選択した状態で、「Tree」をクリックし、UPGMAによる系統樹を作成する。その際各分岐の確からしさをブートストラップ法によって求めるため、「Resample tree」にチェックを入れて「OK」を押す。
行 170: 行 195:
  
 作成した系統樹は既知の系統樹と一致するか、一致しない場合は理由を考えてみる。 作成した系統樹は既知の系統樹と一致するか、一致しない場合は理由を考えてみる。
 +
 +既知の系統樹の例:http://currents.plos.org/treeoflife/index.html%3Fp=2607.html
 +
 +## E. 検討項目の例
 +
 +- プライマーの配列から何塩基くらい離れたところからシーケンスが開始されているか。
 +
 +- NCBI NTデータベースとMitoFishデータベースの相同性検索結果に違いはあったか。どちらが望ましい結果だったか。
 +
 +- 作成した系統樹は既存の分類群(科・属・種名など)がどの程度正しく描けていたか。
 +
 +## F. 提出物
 +
 +11月3日(火)23:55までに、作成した系統樹をパワーポイント等に貼り付けて、ITC-LMSの課題に提出すること。
  • 2020-魚種判別・系統解析.1603559345.txt.gz
  • 最終更新: 2020/10/24 17:09
  • by suikou