# rRNA配列を用いた魚種判別、系統樹解析 サンガーシーケンスのデータを開いて、データベースで相同性検索を行い、肉片の魚種を推定する。さらにシーケンスした配列を含めた魚類の系統樹を作成する。 ## サンプルリスト |番号|食品名| |1|サーモン| |2|コハダ| |3|サバ| |5|アーモンドフィッシュ| |6|蒲焼さん太郎| |8|ちくわ| |10|サンマ| |11|サーモン| |12|ネコのえさ| |13|おにぎり(たらこ)| |14|めんたいこ| |16|いわしチップス| |17|ブリ| {{:pasted:20221110-124454.png}} {{:pasted:20221110-124512.png}} ## A. サンガーシーケンス配列解析、および系統樹作成のプログラムであるGeneiousの体験版をインストール 1.ウェブブラウザを開く。 2.Geneiousのインストールファイルをダウンロードする。下記のページの「Download...」ボタンをクリックします。(スクリーンショットは一部古くなっている箇所もあり、OSやバージョンがずれていることがあります。) https://www.geneious.com/download/ {{:pasted:20201015-161334.png}} 3.「ファイルを保存する」で「OK」を押します。 {{:pasted:20201015-161501.png}} 4.ダウンロードが完了したらダウンロードしたファイルを開き、Geneiousのインストーラに従ってインストールを行います。 {{:pasted:20201015-162537.png}} {{:pasted:20201015-162550.png}} {{:pasted:20201015-162606.png}} {{:pasted:20201015-162633.png}} {{:pasted:20211028-110059.png}} 5.そのままGeneiousを起動します。 6.「Trial Later」をクリックします。 {{:pasted:20201015-162927.png}} ## B. データベースで相同性検索を行う 1.下記のzipデータをダウンロードし、アーカイブマネージャーで開いて、「展開」をクリックし、適当な場所にファイルを解凍する(OSによって操作は多少違います)。とりあえず使うのは各自担当したサンプルのフォワードとリバースのシーケンスデータですが、自分の番号のデータがない人は他のデータを使ってください。 [[http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2022jissyu/2022sanger.zip]] (右クリックして「名前を付けて保存」を選ばないとChromeではダウンロードできません。) {{:pasted:20201020-154035.png}} 2.Geneiousでシーケンスファイルを開く。「Sources」をLocalなど適当な場所を選択しておいて、「File」→「Import」→「From File...」をクリックし、先ほど解凍したシーケンスファイルを選択して、「Import」をクリックする。 {{:pasted:20201020-154531.png}} 3.拡大すると、サンガーシーケンスの波形を見ることが出来る。 {{:pasted:20201020-155035.png}} 4.綺麗に読めた部分だけ抜き出して、別ファイルに保存する。まずは綺麗に読めた部分をドラッグ&ドロップで選択し、右クリックしてコピーを選択する。 {{:pasted:20201027-181254.png}} 5.リストの適当なところで右クリックして、Pasteを押す。 {{:pasted:20201027-181608.png}} 6.フォワードとリバースで抜きだした配列を選択し、アライメントを実行する。 {{:pasted:20201027-181916.png}} 7.自動で配列の向きを合わせてくれるように「Automatically determine direction (slower)」にチェックを入れておく。 {{:pasted:20201027-182029.png}} 8.下記のプライマー配列がコンセンサス配列の両端に出現するか確認してみる。 ``` 16SarL(フォワード) CGCCTGTTTATCAAAAACAT 16SbrH(リバース) CCGGTCTGAACTCAGATCACGT ``` {{:pasted:20221109-110119.png}} 9.Consensus配列をドラッグ&ドロップで選択し、右クリックしてCopyする。 {{:pasted:20201027-182252.png}} 10.下記のNCBI BLASTのページを開いて、「nucleotide -> nucleotide」(通称blastn)を開いて、コピーした配列をクエリーに張り付ける。Databaseにnr/ntが選択されていることを確認して、BLASTをクリックする。nr/ntはGenbankに登録された配列の冗長さを除去した(non-redundantな)データベースで、幅広い生物種・遺伝子が網羅的にバランスよく登録されていて、まずはここで配列を検索する研究者が多い。 https://blast.ncbi.nlm.nih.gov/Blast.cgi {{:pasted:20201020-160022.png}} 11.そのほか、魚類のミトコンドリア専用のデータベースとして、東大岩崎研でメンテナンスされているMitoFishデータベースがある。こちらは2022年11月現在、3,492種の魚の完全長のミトコンドリアが登録されており、BLAST検索が可能である。NCBI NTデータベースと、MitoFishデータベース両方で検索して違いを比較してみる。 http://mitofish.aori.u-tokyo.ac.jp/ 12.ミトコンドリアの配列をデータベースからダウンロードし、シーケンスデータとアライメントを行い、シーケンスした領域がどこだったのか確認する。 NCBI、MitoFishどちらも結果を適当にクリックしていると、ヒットした配列のAccession番号のリンクを見つけることが出来るはず。Accession番号を開くと、GenBankに登録されている配列をアノテーション付きで表示することが可能である。 {{:pasted:20201020-161521.png}} 13.シーケンスデータと相同性のある完全長ミトコンドリアの配列をGenBankで開き、GenBank形式でファイルに保存するを選んでダウンロードする。 {{:pasted:20201020-161800.png}} 14.Geneiousで「File」→「Import」→「From File...」をクリックし、先ほどダウンロードしたGenBankファイルを開く。 15.シーケンスデータと、インポートしたGenBankファイルを選択し、「Align/Assemble」→「Multiple Align...」をクリックする。「Automatically determine direction (slower)」にチェックを入れて「OK」を押す。 {{:pasted:20201027-182953.png}} 16.Alignment ViewでCtrl+Fを押すと、配列を検索する画面が開くので、下記のプライマーの配列を張り付けて検索してみる。もしヒットしない場合は、プライマーの配列が保存されていない可能性もあるため、適当に検索する配列を短くしてヒットするかどうかを見ていく。ヒットする配列は基本的には16S rRNAの中にあるはずである。 ``` 16SarL(フォワード) CGCCTGTTTATCAAAAACAT 16SbrH(リバース) CCGGTCTGAACTCAGATCACGT ``` {{:pasted:20201020-163456.png}} 17.プライマーの配列から何塩基くらい離れたところからシーケンスが開始されているか、シーケンスデータとリファレンス配列が不一致な場所があれば、波形が綺麗に読まれているかどうかを確認する。 自分の担当したサンプル番号とBLASTの結果を、Zoomのチャットに書き込んで提出する。 ## C. 系統樹作成 ミトコンドリア16S rRNAによる魚類の系統樹を作成し、魚類の中での系統関係を解析する。 1.サンガーシーケンスで得られたフォワードとリバースのコンセンサス配列を新しいレコードに保存しておく。 {{:pasted:20221109-165126.png}} 2.下記のファイルには46種の生物のミトコンドリア16S rRNA配列が含まれているのでダウンロードする。 http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2020jissyu/16S-46sp.fasta.zip 3.Geneiousの「File」→「Import」→「From File...」からダウンロードしたファイルを開く。その際、「Nucleotide sequences」→「Keep sequences separate」を選んでおく。 4.各自担当した魚肉の配列と、追加した46種の配列を全て選択して、「Align/Assemble」→「Multiple Align...」をクリックし、マルチプルアライメントを作成する。(しばらく時間がかかる。) 5.マルチプルアライメント結果を選択した状態で、「Tree」をクリックし、UPGMAによる系統樹を作成する。その際各分岐の確からしさをブートストラップ法によって求めるため、「Resample tree」にチェックを入れて「OK」を押す。 {{:pasted:20201020-180315.png}} 6.作成された系統樹には、大分類群から分類名が書かれているため、そのままでは見えづらいので、Tip Labelsを開いて、Max Charsを30→200などに変更して分類名を表示してみる。そうすると、「Chondrichthyes(軟骨魚綱)」と硬骨魚類の属する「Teleostomi(真口亜綱)」で分かれているのが見られるはず。 {{:pasted:20211110-184347.png}} 7.Genbankに登録された配列の中から、興味のある魚種のミトコンドリア16Sを抽出してGeneiousに取り込み、系統樹を作成する。 https://www.ncbi.nlm.nih.gov/nucleotide/ 例えばゼブラフィッシュの16Sを探す場合は、「Danio rerio 16S complete」などで検索してみると良い。 {{:pasted:20201025-020057.png}} 8.Genbankからダウンロードした配列をそのまま使うと、配列の長さが異なり変な系統樹になってしまうので、サンガーシーケンスで得られた配列とアライメントが取れる領域のみを抜き出してから、上記4.のステップに新しく配列を追加する。 追加する配列としては、BLASTでトップヒットした魚種の16Sや、例えばBLASTで日本近海に棲息していない魚がトップヒットした場合などは日本近海の近縁種の配列などを試してほしい。 既知の系統樹の例: {{:pasted:20211028-110734.png?800}} https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3682800/ ## D. 検討項目の例 - プライマーの配列から何塩基くらい離れたところからシーケンスが開始されているか。 - NCBI NTデータベースとMitoFishデータベースの相同性検索結果に違いはあったか。どちらが望ましい結果だったか。 - BLASTでヒットしたトップヒットの種や近縁種の配列をGenbankからダウンロードして系統樹に追加してみると期待したとおりになったか。