差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
2020-魚種判別・系統解析 [2020/10/24 17:38] – [E. 検討項目] suikou | 2020-魚種判別・系統解析 [2020/10/29 15:52] (現在) – suikou | ||
---|---|---|---|
行 1: | 行 1: | ||
# rRNA配列を用いた魚種判別、系統樹解析 | # rRNA配列を用いた魚種判別、系統樹解析 | ||
- | サンガーシーケンスのデータを開いて、データベースで相同性検索を行い、肉片の魚種を推定する。またシーケンスした配列を含めた系統樹を作成する。 | + | サンガーシーケンスのデータを開いて、データベースで相同性検索を行い、肉片の魚種を推定する。さらにシーケンスした配列を含めた魚類の系統樹を作成する。 |
+ | |||
+ | 使用した切り身の写真 | ||
+ | |サンプル1, | ||
+ | |サンプル4, | ||
+ | |サンプル7, | ||
+ | |サンプル15, | ||
+ | |||
+ | サンガーシーケンスの結果 | ||
+ | http:// | ||
## A. 使用するコンピュータについて | ## A. 使用するコンピュータについて | ||
- | 今回行う解析はメモリ8GB以上、HDDの空き容量が50GBあるPCであれば十分です。もし十分なスペックのPCが手元にあれば、自分のPCで解析することを推奨します。もし十分なスペックがない場合は、水圏生物工学研究室のPCを遠隔で使用することが可能です。 | + | 今回行う解析はメモリ8GB以上、HDDの空き容量が50GBあるPCであれば十分です。もし十分なスペックのPCが手元にあれば、自分のPCで解析することを推奨します。 |
+ | |||
+ | もし十分なスペックがない場合は、水圏生物工学研究室のPCを遠隔で使用することが可能です。 | ||
下記の4つのいずれかの環境を選択し、それぞれ事前準備を進めてください。 | 下記の4つのいずれかの環境を選択し、それぞれ事前準備を進めてください。 | ||
行 37: | 行 48: | ||
{{: | {{: | ||
- | 5.デスクトップにある「端末」アイコンをダブルクリックしてターミナルを開きます。 | + | 5.ターミナルを開くために、画面下のタイル状のアイコンをクリックし、「ユーティリティ」→「端末」アイコンをダブルクリックしてターミナルを開きます。場所は多少違うことが有ります。 |
- | {{:pasted:20201015-161751.png}} | + | {{:pasted:20201027-175705.png}} |
6.ダウンロードしたGeneiousのインストーラを実行するために下記のコマンドを入力します。 | 6.ダウンロードしたGeneiousのインストーラを実行するために下記のコマンドを入力します。 | ||
行 74: | 行 85: | ||
{{: | {{: | ||
- | 8.Geneiousを起動します。ターミナル上で次のコマンドを入力してください。 | + | 8.Geneiousを起動します。 |
- | ``` | + | {{:pasted:20201027-180126.png}} |
- | / | + | |
- | ``` | + | |
- | + | ||
- | {{:pasted:20201015-163118.png}} | + | |
9.「Trial Later」をクリックします。 | 9.「Trial Later」をクリックします。 | ||
行 88: | 行 95: | ||
## C. データベースで相同性検索を行う | ## C. データベースで相同性検索を行う | ||
- | 1.下記のzipデータをダウンロードし、アーカイブマネージャーで開いて、「展開」をクリックし、適当な場所にファイルを解凍する。(現在は仮のデータ。XXX.ab1を使えば良い。) | + | 1.下記のzipデータをダウンロードし、アーカイブマネージャーで開いて、「展開」をクリックし、適当な場所にファイルを解凍する。とりあえず使うのは各自担当したサンプルのフォワードとリバースのシーケンスデータ。 |
- | http://www.suikou.fs.a.u-tokyo.ac.jp/ | + | http:// |
{{: | {{: | ||
- | 2.Geneiousでシーケンスファイルを開く。「Sources」をLocalなど適当な場所を選択しておいて、「File」→「Import」→「Frome File...」をクリックし、先ほど解凍したシーケンスファイルを選択して、「Import」をクリックする。 | + | 2.Geneiousでシーケンスファイルを開く。「Sources」をLocalなど適当な場所を選択しておいて、「File」→「Import」→「From File...」をクリックし、先ほど解凍したシーケンスファイルを選択して、「Import」をクリックする。 |
{{: | {{: | ||
行 102: | 行 109: | ||
{{: | {{: | ||
- | 4.シーケンス結果から塩基配列を取得するには、「Text View」を開いて、読めていそうな範囲を選択し、配列を「Copy」する。数字もコピーされてしまうが、この後実行するBlast検索では塩基配列以外の文字列は削除され影響が無いのでそのまま進む。 | + | 4.綺麗に読めた部分だけ抜き出して、別ファイルに保存する。まずは綺麗に読めた部分をドラッグ&ドロップで選択し、右クリックしてコピーを選択する。 |
- | {{:pasted:20201020-155942.png}} | + | {{:pasted:20201027-181254.png}} |
- | 5.下記のNCBI BLASTのページを開いて、「nucleotide -> nucleotide」(通称blastn)を開いて、コピーした配列をクエリーに張り付ける。Databaseにnr/ | + | 5.リストの適当なところで右クリックして、Pasteを押す。 |
+ | |||
+ | {{: | ||
+ | |||
+ | 6.フォワードとリバースで抜きだした配列を選択し、アライメントを実行する。 | ||
+ | |||
+ | {{: | ||
+ | |||
+ | 7.自動で配列の向きを合わせてくれるように「Automatically determine direction (slower)」にチェックを入れておく。 | ||
+ | |||
+ | {{: | ||
+ | |||
+ | 8.Consensus配列をドラッグ&ドロップで選択し、右クリックしてCopyする。 | ||
+ | |||
+ | {{: | ||
+ | |||
+ | 9.下記のNCBI BLASTのページを開いて、「nucleotide -> nucleotide」(通称blastn)を開いて、コピーした配列をクエリーに張り付ける。Databaseにnr/ | ||
https:// | https:// | ||
行 112: | 行 135: | ||
{{: | {{: | ||
- | 6.そのほか、魚類のミトコンドリア専用のデータベースとして、東大岩崎研で維持されているMitoFishデータベースがある。 | + | 10.そのほか、魚類のミトコンドリア専用のデータベースとして、東大岩崎研でメンテナンスされているMitoFishデータベースがある。 |
http:// | http:// | ||
- | こちらは2020年10月現在、2, | + | こちらは2020年10月現在、2, |
+ | |||
+ | 11.ミトコンドリアの配列をデータベースからダウンロードし、シーケンスデータとアライメントを行い、シーケンスした領域がどこだったのか確認する。 | ||
- | 7.ミトコンドリアの配列と、シーケンスデータのアライメント。NCBI、MitoFishどちらも結果を適当にクリックしていると、ヒットした配列のAccession番号のリンクを見つけることが出来るはず。Accession番号を開くと、Genbankに登録されている配列を直接表示することが可能である。 | + | NCBI、MitoFishどちらも結果を適当にクリックしていると、ヒットした配列のAccession番号のリンクを見つけることが出来るはず。Accession番号を開くと、GenBankに登録されている配列をアノテーション付きで表示することが可能である。 |
{{: | {{: | ||
- | 8.シーケンスデータと相同性のある完全長ミトコンドリアの配列をGenbankから探し、GenBank形式でファイルに保存するを選んでダウンロードする。 | + | 12.シーケンスデータと相同性のある完全長ミトコンドリアの配列をGenBankで開き、GenBank形式でファイルに保存するを選んでダウンロードする。 |
{{: | {{: | ||
- | 9.Geneiousで「File」→「Import」→「Frome File...」をクリックし、先ほどダウンロードしたGenBankファイルを開く。 | + | 13.Geneiousで「File」→「Import」→「From File...」をクリックし、先ほどダウンロードしたGenBankファイルを開く。 |
- | 10.シーケンスデータと、インポートしたGenBankファイルを選択し、「Align/ | + | 14.シーケンスデータと、インポートしたGenBankファイルを選択し、「Align/ |
- | {{:pasted:20201020-162300.png}} | + | {{:pasted:20201027-182953.png}} |
- | 11.無料版だと、アライメントで高速なMUSCLEなどの外部プログラムが実行できないので、Geneious Alignmentを使用する。Geneious Alignmentには自動で配列の向きを揃えてくれる機能があるので便利。「Automatically determine direction (slower)」にチェックを入れて「OK」を押す。 | + | 15.Alignment ViewでCtrl+Fを押すと、配列を検索する画面が開くので、下記のプライマーの配列を張り付けて検索してみる。もしヒットしない場合は、プライマーの配列が保存されていない可能性もあるため、適当に検索する配列を短くしてヒットするかどうかを見ていく。ヒットする配列は基本的には16S rRNAの中にあるはずである。 |
- | + | ||
- | 12.Alignment ViewでCtrl+Fを押すと、配列を検索する画面が開くので、下記のプライマーの配列を張り付けて検索してみる。もしヒットしない場合は、プライマーの配列が保存されていない可能性もあるため、適当に検索する配列を短くしてヒットするかどうかを見ていく。ヒットする配列は基本的には16S rRNAの中にあるはずである。 | + | |
``` | ``` | ||
行 143: | 行 166: | ||
{{: | {{: | ||
- | 13.プライマーの配列から何塩基くらい離れたところからシーケンスが開始されているか、シーケンスデータとリファレンス配列が不一致な場所があれば、波形が綺麗に読まれているかどうかを確認する。 | + | 16.プライマーの配列から何塩基くらい離れたところからシーケンスが開始されているか、シーケンスデータとリファレンス配列が不一致な場所があれば、波形が綺麗に読まれているかどうかを確認する。 |
+ | |||
+ | 自分の担当したサンプル番号の魚を上の切り身の写真と、配列の検索結果から推定し、Zoomのチャットに書き込む。 | ||
## D. 系統樹作成 | ## D. 系統樹作成 | ||
行 151: | 行 176: | ||
1.下記のファイルには46種の生物のミトコンドリア16S rRNA配列が含まれているのでダウンロードする。 | 1.下記のファイルには46種の生物のミトコンドリア16S rRNA配列が含まれているのでダウンロードする。 | ||
- | http://www.suikou.fs.a.u-tokyo.ac.jp/ | + | http:// |
- | 2.Geneiousの「File」→「Import」→「Frome File...」からダウンロードしたファイルを開く。その際、「Nucleotide sequences」→「Keep sequences separate」を選んでおく。 | + | 2.Geneiousの「File」→「Import」→「From File...」からダウンロードしたファイルを開く。その際、「Nucleotide sequences」→「Keep sequences separate」を選んでおく。 |
- | 3.開いた配列を全て選択して、「Align/ | + | 3.開いた配列を全て選択して、「Align/ |
4.マルチプルアライメント結果を選択した状態で、「Tree」をクリックし、UPGMAによる系統樹を作成する。その際各分岐の確からしさをブートストラップ法によって求めるため、「Resample tree」にチェックを入れて「OK」を押す。 | 4.マルチプルアライメント結果を選択した状態で、「Tree」をクリックし、UPGMAによる系統樹を作成する。その際各分岐の確からしさをブートストラップ法によって求めるため、「Resample tree」にチェックを入れて「OK」を押す。 | ||
行 170: | 行 195: | ||
作成した系統樹は既知の系統樹と一致するか、一致しない場合は理由を考えてみる。 | 作成した系統樹は既知の系統樹と一致するか、一致しない場合は理由を考えてみる。 | ||
+ | |||
+ | 既知の系統樹の例:http:// | ||
## E. 検討項目の例 | ## E. 検討項目の例 | ||
- プライマーの配列から何塩基くらい離れたところからシーケンスが開始されているか。 | - プライマーの配列から何塩基くらい離れたところからシーケンスが開始されているか。 | ||
- | |||
- | - サンガー法では何塩基くらいまでなら間違えずに読めていそうか。 | ||
- NCBI NTデータベースとMitoFishデータベースの相同性検索結果に違いはあったか。どちらが望ましい結果だったか。 | - NCBI NTデータベースとMitoFishデータベースの相同性検索結果に違いはあったか。どちらが望ましい結果だったか。 | ||
行 183: | 行 208: | ||
## F. 提出物 | ## F. 提出物 | ||
- | 11月3日(火)23: | + | 11月3日(火)23: |