2024-メタゲノム・edna

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
2024-メタゲノム・edna [2024/10/29 03:46] suikou2024-メタゲノム・edna [2024/11/07 05:55] (現在) yonezawa
行 43: 行 43:
  
 4班:チーズ 4班:チーズ
 +
 +{{:266684.jpg?400|}}
  
 ## PCR結果まとめ ## PCR結果まとめ
行 64: 行 66:
 スタッフによる追加実験: スタッフによる追加実験:
  
-{{:pasted:20241029-034557.png?400}}+{{:pasted:20241029-034557.png?600}}
  
 ## ナノポアシーケンス結果 ## ナノポアシーケンス結果
行 82: 行 84:
 これからダウンロードするファイルを入れるディレクトリを作成し、その中にすべてのファイルをダウンロードします。とりあえずここではダウンロードフォルダの中に「2024jissyu」というフォルダを作り、そこにこれからダウンロードするファイルを全部移動させたことを前提に書いてあります。(注意:今回使用するプログラムはフォルダ名が日本語になっていると正常動作しません。もしWindowsで「C:\Users\XXX\Downloads\東大学生実験\2024jissyu」などとパスに日本語が含まれる場合は、「C:\Users\XXX\Downloads\2024jissyu」など途中に日本語フォルダを挟まないフォルダを作ってその中にダウンロードして下さい。OneDriveでダウンロードフォルダを同期させていると「C:\Users\XXX\ダウンロード」と日本語になっていることもあるので注意。) これからダウンロードするファイルを入れるディレクトリを作成し、その中にすべてのファイルをダウンロードします。とりあえずここではダウンロードフォルダの中に「2024jissyu」というフォルダを作り、そこにこれからダウンロードするファイルを全部移動させたことを前提に書いてあります。(注意:今回使用するプログラムはフォルダ名が日本語になっていると正常動作しません。もしWindowsで「C:\Users\XXX\Downloads\東大学生実験\2024jissyu」などとパスに日本語が含まれる場合は、「C:\Users\XXX\Downloads\2024jissyu」など途中に日本語フォルダを挟まないフォルダを作ってその中にダウンロードして下さい。OneDriveでダウンロードフォルダを同期させていると「C:\Users\XXX\ダウンロード」と日本語になっていることもあるので注意。)
  
-SeqKit+#### SeqKit
  
  https://bioinf.shenwei.me/seqkit/download/  https://bioinf.shenwei.me/seqkit/download/
行 102: 行 104:
 ``` ```
  
-BLAST+#### BLAST
  
  https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.16.0/  https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.16.0/
行 117: 行 119:
 ``` ```
  
-FastQC+#### FastQC
  
  https://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc  https://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc
行 131: 行 133:
  Macは「[[https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.12.1.dmg|FastQC v0.12.1 (Mac DMG image)]]」をダウンロードし、ダブルクリックしてイメージをマウントしておく。  Macは「[[https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.12.1.dmg|FastQC v0.12.1 (Mac DMG image)]]」をダウンロードし、ダブルクリックしてイメージをマウントしておく。
  
-Javaランタイム+#### Javaランタイム
  
  FastQCを実行するのに必要。https://www.java.com/ja/download/manual.jsp より適切なJavaをインストールする。  FastQCを実行するのに必要。https://www.java.com/ja/download/manual.jsp より適切なJavaをインストールする。
行 139: 行 141:
  {{:pasted:20241029-033133.png}}  {{:pasted:20241029-033133.png}}
  
-MEGAN+#### MEGAN
  
  http://software-ab.cs.uni-tuebingen.de/download/megan6/welcome.html  http://software-ab.cs.uni-tuebingen.de/download/megan6/welcome.html
行 171: 行 173:
 - 16S rRNA、18S rRNA、ミトコンドリア、葉緑体等のメタバーコーディングで使用される領域をまとめたFASTAファイルをダウンロードして各自OSの機能でzipファイルを解凍し、中身の`silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta`を「2024jissyu」フォルダにコピーしておく。 - 16S rRNA、18S rRNA、ミトコンドリア、葉緑体等のメタバーコーディングで使用される領域をまとめたFASTAファイルをダウンロードして各自OSの機能でzipファイルを解凍し、中身の`silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta`を「2024jissyu」フォルダにコピーしておく。
  
-[[https://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2023jissyu/silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta.zip]]+ [[https://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2023jissyu/silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta.zip]]
  
-このファイルは、NCBI blast database (ミトコンドリア、葉緑体)、PR2(18S rRNAなど)、SILVA(16S rRNA, 23S rRNA)、MitoFish (MiFish用12S rRNA)をマージして作ったもの。具体的には下記のファイルをマージしたもの。+ このファイルは、NCBI blast database (ミトコンドリア、葉緑体)、PR2(18S rRNAなど)、SILVA(16S rRNA, 23S rRNA)、MitoFish (MiFish用12S rRNA)をマージして作ったもの。具体的には下記のファイルをマージしたもの。
  
-`https://ftp.ncbi.nlm.nih.gov/blast/db/ から16S_ribosomal_RNA、LSU_prokaryote_rRNA、mito`+ `https://ftp.ncbi.nlm.nih.gov/blast/db/ から16S_ribosomal_RNA、LSU_prokaryote_rRNA、mito`
  
-`http://ftp.ncbi.nih.gov/refseq/release/plastid/ からplastid.*.genomic.fna.gz`+ `http://ftp.ncbi.nih.gov/refseq/release/plastid/ からplastid.*.genomic.fna.gz`
  
-`https://github.com/pr2database/pr2database/releases/download/v4.14.0/pr2_version_4.14.0_SSU_taxo_long.fasta.gz`+ `https://github.com/pr2database/pr2database/releases/download/v4.14.0/pr2_version_4.14.0_SSU_taxo_long.fasta.gz`
  
-`https://www.arb-silva.de/fileadmin/silva_databases/current/Exports/SILVA_138.1_LSURef_NR99_tax_silva_trunc.fasta.gz`+ `https://www.arb-silva.de/fileadmin/silva_databases/current/Exports/SILVA_138.1_LSURef_NR99_tax_silva_trunc.fasta.gz`
  
-`https://www.arb-silva.de/fileadmin/silva_databases/current/Exports/SILVA_138.1_SSURef_NR99_tax_silva_trunc.fasta.gz`+ `https://www.arb-silva.de/fileadmin/silva_databases/current/Exports/SILVA_138.1_SSURef_NR99_tax_silva_trunc.fasta.gz`
  
-`http://mitofish.aori.u-tokyo.ac.jp/species/detail/download/?filename=download%2F/complete_partial_mitogenomes.zip`+ `http://mitofish.aori.u-tokyo.ac.jp/species/detail/download/?filename=download%2F/complete_partial_mitogenomes.zip`
  
 - Nanoporeのシーケンスデータ ・・・メタゲノムとeDNAのデータが入っています。 - Nanoporeのシーケンスデータ ・・・メタゲノムとeDNAのデータが入っています。
    
- [[http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2024jissyu/2024nanopore.zip]]+ [[https://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2024jissyu/2024nanopore.zip]]
    
- zipファイルを解凍し、中身のgroupX_XXX.fqファイルを「2024jissyu」フォルダにコピーしておく。+ zipファイルを解凍し、中身の`X_XXX_1st.fq`, `X_XXX_2nd.fq`ファイルを「2024jissyu」フォルダにコピーしておく。`_1st`は三年生の皆さんがPCRしてナノポアシーケンスしたデータ、`_2nd`はデータが少なかったサンプルを研究室のスタッフで追加実験したデータ
    
- ・ eDNA解析: groupX-eDNA.fqのファイルを使用+ ・ eDNA解析: X-eDNA.fqのファイルを使用
    
- ・ メタゲノム解析(水・食品): groupX-food-xxxx.fq, groupX-metagenome-xxxx.fqのファイルを使用+ ・ メタゲノム解析(水・食品): X-food.fq, X-metagenome.fqのファイルを使用
  
 ## B. クオリティチェック ## B. クオリティチェック
行 213: 行 215:
  {{:pasted:20221105-183402.png}}  {{:pasted:20221105-183402.png}}
    
- 一度「キャンセル」して、「システム環境設定」を開き、 + 一度「キャンセル」して、「システム環境設定」を開き、 「プライバシーとセキュリティ」を開き、「このまま開く」をクリックしてFastQCを開く。
-  +
- {{:pasted:20221105-183659.png}} +
-  +
- 「プライバシーとセキュリティ」を開き、「このまま開く」をクリックしてFastQCを開く。+
    
  {{:pasted:20241029-031323.png}}  {{:pasted:20241029-031323.png}}
行 258: 行 256:
  
 ``` ```
-./seqkit fq2fa input_file.fastq -o output_file.fasta +./seqkit fq2fa -o 1-metagehome_1st.fasta 1-metagehome_1st.fq
 ``` ```
  
-```input_file.fastq```, ```output_file.fasta```は適当に変更すること。 +```1-metagehome_1st.fq```, ```1-metagehome_1st.fasta```は適当に変更すること。  
 + 
 +もしリード数が多い場合は、後のblast検索で時間がかかるので、例えば500リードなどにダウンサンプリングしておく。(特にfood, metagenomeサンプルはリード長が長く、blast検索に時間がかかるのでリード数を減らしておくことを推奨) 
 + 
 +``` 
 +#例 
 +./seqkit sample -n 500 -o 1-metagehome_1st_500.fasta 1-metagehome_1st.fasta 
 +```
  
 ### コマンド入力時の便利キー ### コマンド入力時の便利キー
行 288: 行 293:
  
 ``` ```
-./ncbi-blast-2.16.0+/bin/blastn -db silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta -query input.fasta -num_threads 16 -out input.fasta.blastn+./ncbi-blast-2.16.0+/bin/blastn -db silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta -query 1-metagehome_1st_500.fasta -num_threads 16 -out 1-metagehome_1st_500.fasta.blastn
 ``` ```
  
行 305: 行 310:
 ``` ```
 ## Windows (PowerShell)の場合 ## Windows (PowerShell)の場合
-Get-Content -head 30 input.fasta.blastn+Get-Content -head 30 1-metagehome_1st_500.fasta.blastn
  
 ## Mac/Linuxの場合 ## Mac/Linuxの場合
-head -n 30 input.fasta.blastn+head -n 30 1-metagehome_1st_500.fasta.blastn
  
-input.fasta.blastn は適当なファイル名に変更します。+1-metagehome_1st_500.fasta.blastn は適当なファイル名に変更します。
 ``` ```
  
行 394: 行 399:
 そのほか、「データ」→「フィルター」を使ってみたり、グラフを描いてみたりするのが通常の解析の流れになるかと思います。 そのほか、「データ」→「フィルター」を使ってみたり、グラフを描いてみたりするのが通常の解析の流れになるかと思います。
  
-## F. 最終日のプレゼンテーションの内容 
- 
-各班次の内容について「目的」、「方法」、「結果」、「考察」の4つのパートを明確に区別してプレゼンテーションを作成してください。班ごとに発表し、発表時間は質疑応答を入れて30分です。 
- 
-``` 
-X班.食品の品種判別 by サンガー 
-X班.三四郎池のeDNA 
-X班.発酵食品のメタゲノム 
-X班.三四郎池のメタゲノム 
-``` 
- 
-各テーマごとに例えば下記のような項目について考察をすること。インターネットを積極的に使用して調べることを推奨します。また、ある程度調べてもわからないことがあればTA・スタッフに聞いてみてください。 
- 
-・X班.食品の品種判別 by サンガー 
- 
-NCBIのデータベースとMitoFishのデータベースを比べて、ヒットした種が同じかどうか調べ、どちらのデータベースのほうが良さそうか考えてみる。 
- 
-ネガティブコントロールでもPCR増幅してしまった理由を考えて、どうすればネガティブコントロールで増幅しないようにできるか、どうやって検証するか考える。 
- 
-手法で詳しく説明して欲しい箇所:「DNA抽出」(使用したキットはDNeasy Blood & Tissue Kitsです。) 
- 
-・X班.三四郎池のeDNA 
- 
-検出された魚は三四郎池に棲息していそうな魚かどうか。 
- 
-三年前の三四郎池のデータとも比較してみてください。http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2021jissyu/2021nanopore.zip (group2-12S-Sanshiroike1.fq) 
- 
-手法で詳しく説明して欲しい箇所:「電気泳動、DNA精製」(使用したキットはFastGene™ Gel/PCRExtractionキットです。) 
- 
-・X班.発酵食品のメタゲノム 
- 
-今回発酵食品で検出されるバクテリアはほぼ1種類だと思うので、精度の悪いナノポアのリードの精度を向上させる方法を実践してみてください。具体的にはGeneiousでマルチプルアライメントを作成して、コンセンサス配列を作ることで、NCBIのBlastで一致率99%程度のヒットが得られるようになることを確認し、ナノポアのリードはどのような間違いが多いのか考察してみてください。 
- 
-加工食品から検出された魚は妥当でしょうか。No Hitのリードを抜き出して、NCBIのBLASTにかけてみると何がヒットしますか?(リードを抜き出す例: `./seqkit grep -rp "1e2f600e-220b-4144-93b0-75ccd2c537de:35:1568:-1:bac-27F-BC05:bac-1492R" ./2022nanopore/y2022-group1-bacteria-16S-Sanshiro.fq`) 
- 
-手法で詳しく説明して欲しい箇所:「PCR」(使用したDNAポリメラーゼはrepliQa HiFi ToughMixです。AmpliTaq GoldやEx Taqといった他の酵素と比較して、どういった特徴があるでしょうか。) 
- 
-・X班.三四郎池のメタゲノム 
- 
-検出されたバクテリアは淡水環境で良く検出されているでしょうか? 
- 
-二年前の三四郎池のデータとも比較してみてください。http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2021jissyu/2021nanopore.zip (group2-16S-Sanshiroike1.fq) 
- 
-手法で詳しく説明して欲しい箇所:「ナノポアシーケンシング」(使用したライブラリー調整キットはSQK-LSK110です。公式マニュアル:http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2022jissyu/amplicons-by-ligation-sqk-lsk110-ACDE_9110_v110_revT_10Nov2020-minion.pdf ) 
- 
-## G. 課題 
  
-来週のプレゼン資料の完成版をファイルに保存して、発表時に提出すること。 
  • 2024-メタゲノム・edna.1730173605.txt.gz
  • 最終更新: 2024/10/29 03:46
  • by suikou