差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
2023-メタゲノム・edna [2023/11/07 07:11] – suikou | 2023-メタゲノム・edna [2023/11/09 00:57] (現在) – suikou | ||
---|---|---|---|
行 42: | 行 42: | ||
## ナノポアシーケンス結果 | ## ナノポアシーケンス結果 | ||
- | クオリティスコアQは、エラーの生じる確率 | + | クオリティスコアQから、エラーの生じる確率 |
{{: | {{: | ||
行 54: | 行 54: | ||
### 1. ツールのインストール | ### 1. ツールのインストール | ||
- | これからダウンロードするファイルを入れるディレクトリを作成し、その中にすべてのファイルをダウンロードする。とりあえずここではWindowsでダウンロードフォルダの中に「2023jissyu」というフォルダを作ったとする。(注意:今回使用するプログラムはフォルダ名が日本語になっていると正常動作しません。もし「C: | + | これからダウンロードするファイルを入れるディレクトリを作成し、その中にすべてのファイルをダウンロードする。とりあえずここではWindowsでダウンロードフォルダの中に「2023jissyu」というフォルダを作ったとします。(注意:今回使用するプログラムはフォルダ名が日本語になっていると正常動作しません。もし「C: |
- SeqKit | - SeqKit | ||
行 62: | 行 62: | ||
| | ||
- | | + | |
+ | |||
+ | | ||
``` | ``` | ||
行 74: | 行 76: | ||
- BLAST | - BLAST | ||
- | | + | |
- | | + | |
``` | ``` | ||
# | # | ||
- | tar vxf ncbi-blast-2.15.0+-x64-win64.tar.gz | + | ## Windows |
+ | tar vxf ncbi-blast-2.12.0+-x64-win64.tar.gz | ||
+ | |||
+ | ## Mac | ||
+ | tar vxf ncbi-blast-2.12.0+-x64-macosx.tar.gz | ||
``` | ``` | ||
行 87: | 行 93: | ||
| | ||
- | | ||
- | |||
| | ||
- | |||
- | | ||
+ | | ||
+ | |||
+ | ``` | ||
+ | Expand-Archive -Path fastqc_v0.12.1.zip -DestinationPath . | ||
+ | ``` | ||
+ | |||
+ | | ||
+ | |||
- MEGAN | - MEGAN | ||
行 111: | 行 121: | ||
{{: | {{: | ||
- | | + | |
{{: | {{: | ||
行 121: | 行 131: | ||
### 2. データベースのダウンロード | ### 2. データベースのダウンロード | ||
- | - 16S rRNA、18S rRNA、ミトコンドリア、葉緑体等のメタバーコーディングで使用される領域をまとめたFASTAファイル | + | - 16S rRNA、18S rRNA、ミトコンドリア、葉緑体等のメタバーコーディングで使用される領域をまとめたFASTAファイルをダウンロードして各自OSの機能でzipファイルを解凍し、中身の`silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta`を「2023jissyu」フォルダにコピーしておく。 |
- | [[http:// | + | [[http:// |
このファイルは、NCBI blast database (ミトコンドリア、葉緑体)、PR2(18S rRNAなど)、SILVA(16S rRNA, 23S rRNA)、MitoFish (MiFish用12S rRNA)をマージして作ったもの。具体的には下記のファイルをマージ。 | このファイルは、NCBI blast database (ミトコンドリア、葉緑体)、PR2(18S rRNAなど)、SILVA(16S rRNA, 23S rRNA)、MitoFish (MiFish用12S rRNA)をマージして作ったもの。具体的には下記のファイルをマージ。 | ||
`https:// | `https:// | ||
+ | |||
`http:// | `http:// | ||
`https:// | `https:// | ||
+ | |||
`https:// | `https:// | ||
+ | |||
`https:// | `https:// | ||
+ | |||
`http:// | `http:// | ||
- Nanoporeのシーケンスデータ ・・・メタゲノムとeDNAのデータが入っています。 | - Nanoporeのシーケンスデータ ・・・メタゲノムとeDNAのデータが入っています。 | ||
- | + | ||
- | [[http:// | + | |
- | + | ||
- | | + | |
- | + | ||
- | - eDNA解析: | + | ・ eDNA解析: groupX-fish-water.fqのファイルを使用 |
- | - 品種判別(食品): | + | |
- | - メタゲノム解析(水・食品): | + | ・ メタゲノム解析(水・食品): |
## B. クオリティチェック | ## B. クオリティチェック | ||
FastQCは主にIllumina用のクオリティチェックツールなので、Nanoporeのデータに対しては適切な評価ができておらず、評価値の〇×は気にしなくてよいです。 | FastQCは主にIllumina用のクオリティチェックツールなので、Nanoporeのデータに対しては適切な評価ができておらず、評価値の〇×は気にしなくてよいです。 | ||
- | |||
### FASTQCを実行するには… | ### FASTQCを実行するには… | ||
行 211: | 行 224: | ||
``` | ``` | ||
- | ./seqkit fq2fa ./ | + | ./seqkit fq2fa input_file.fastq -o output_file.fasta |
``` | ``` | ||
行 229: | 行 242: | ||
``` | ``` | ||
# | # | ||
- | ./ | + | ./ |
``` | ``` | ||
行 241: | 行 254: | ||
``` | ``` | ||
- | ./ | + | ./ |
``` | ``` | ||
行 289: | 行 302: | ||
{{: | {{: | ||
- | 5.「LCA Params」タブを開いて、Top Percent: の値を0.5に変更しておきます。このパラメータは、BLASTの結果の中で最もスコアの高いトップヒットからどの程度離れたヒットまで使用するかの閾値になります。ナノポアではシーケンス精度が悪く、無関係な生物も似たようなスコアでヒットしてしまうため、ほぼトップヒットしか使わないように厳しめに閾値を設定しておきます。それから、Min Score: の値をバクテリア16Sではリード長が1500bp程度なので1000、魚類16Sではリード長が600bp程度なので300、魚類12Sではリード長が200bp程度なので100などと指定し、スコアの低いリードをトリミングします。 | + | 5.「LCA Params」タブを開いて、Top Percent: の値を0.5に変更しておきます。このパラメータは、BLASTの結果の中で最もスコアの高いトップヒットからどの程度離れたヒットまで使用するかの閾値になります。ナノポアではシーケンス精度が悪く、無関係な生物も似たようなスコアでヒットしてしまうため、ほぼトップヒットしか使わないように厳しめに閾値を設定しておきます。それから、Min Score: の値をバクテリア16Sではリード長が1500bp程度なので1000、魚類16Sではリード長が600bp程度なので300、魚類12Sではリード長が200bp程度なので100などと指定し、スコアの低いリードをトリミングします。「Apply」を押すとファイルを読み込みます。 |
{{: | {{: | ||
行 345: | 行 358: | ||
そのほか、「データ」→「フィルター」を使ってみたり、グラフを描いてみたりするのが通常の解析の流れになるかと思います。 | そのほか、「データ」→「フィルター」を使ってみたり、グラフを描いてみたりするのが通常の解析の流れになるかと思います。 | ||
+ | |||
## F. 明日の内容 | ## F. 明日の内容 | ||
- | 各班次の内容について「目的」、「方法」、「結果」、「考察」の4つのパートを明確に区別してプレゼンテーションを作成する。班ごとに発表し、発表時間は質疑応答を入れて30分。 | + | 各班次の内容について「目的」、「方法」、「結果」、「考察」の4つのパートを明確に区別してプレゼンテーションを作成してください。班ごとに発表し、発表時間は質疑応答を入れて30分。 |
``` | ``` | ||
- | 1班.食品の品種判別 by サンガー | + | X班.食品の品種判別 by サンガー |
- | 2班.三四郎池のeDNA | + | X班.三四郎池のeDNA |
- | 3班.発酵食品のメタゲノム、加工食品の品種判別 by ナノポア | + | X班.発酵食品のメタゲノム |
- | 4班.三四郎池のメタゲノム | + | X班.三四郎池のメタゲノム |
``` | ``` | ||
各テーマごとに例えば下記のような項目について考察をすること。インターネットを積極的に使用して調べることを推奨します。また、ある程度調べてもわからないことがあればTA・スタッフに聞いてみてください。 | 各テーマごとに例えば下記のような項目について考察をすること。インターネットを積極的に使用して調べることを推奨します。また、ある程度調べてもわからないことがあればTA・スタッフに聞いてみてください。 | ||
- | ・1班.食品の品種判別 by サンガー | + | ・X班.食品の品種判別 by サンガー |
NCBIのデータベースとMitoFishのデータベースを比べて、ヒットした種が同じかどうか調べ、どちらのデータベースのほうが良さそうか考えてみる。 | NCBIのデータベースとMitoFishのデータベースを比べて、ヒットした種が同じかどうか調べ、どちらのデータベースのほうが良さそうか考えてみる。 | ||
- | ヒットした近縁種の配列をGenbankからダウンロードして加え、系統樹を描いてみる。 | + | ネガティブコントロールでもPCR増幅してしまった理由を考えて、どうすればネガティブコントロールで増幅しないようにできるか、どうやって検証するか考える。 |
手法で詳しく説明して欲しい箇所:「DNA抽出」(使用したキットはDNeasy Blood & Tissue Kitsです。) | 手法で詳しく説明して欲しい箇所:「DNA抽出」(使用したキットはDNeasy Blood & Tissue Kitsです。) | ||
- | ・2班.三四郎池のeDNA | + | ・X班.三四郎池のeDNA |
検出された魚は三四郎池に棲息していそうな魚かどうか。 | 検出された魚は三四郎池に棲息していそうな魚かどうか。 | ||
+ | |||
+ | 二年前の三四郎池のデータとも比較してみてください。http:// | ||
手法で詳しく説明して欲しい箇所:「電気泳動、DNA精製」(使用したキットはFastGene™ Gel/ | 手法で詳しく説明して欲しい箇所:「電気泳動、DNA精製」(使用したキットはFastGene™ Gel/ | ||
- | ・3班.発酵食品のメタゲノム、加工食品の品種判別 by ナノポア | + | ・X班.発酵食品のメタゲノム |
今回発酵食品で検出されるバクテリアはほぼ1種類だと思うので、精度の悪いナノポアのリードの精度を向上させる方法を実践してみてください。具体的にはGeneiousでマルチプルアライメントを作成して、コンセンサス配列を作ることで、NCBIのBlastで一致率99%程度のヒットが得られるようになることを確認し、ナノポアのリードはどのような間違いが多いのか考察してみてください。 | 今回発酵食品で検出されるバクテリアはほぼ1種類だと思うので、精度の悪いナノポアのリードの精度を向上させる方法を実践してみてください。具体的にはGeneiousでマルチプルアライメントを作成して、コンセンサス配列を作ることで、NCBIのBlastで一致率99%程度のヒットが得られるようになることを確認し、ナノポアのリードはどのような間違いが多いのか考察してみてください。 | ||
行 380: | 行 396: | ||
手法で詳しく説明して欲しい箇所:「PCR」(使用したDNAポリメラーゼはrepliQa HiFi ToughMixです。AmpliTaq GoldやEx Taqといった他の酵素と比較して、どういった特徴があるでしょうか。) | 手法で詳しく説明して欲しい箇所:「PCR」(使用したDNAポリメラーゼはrepliQa HiFi ToughMixです。AmpliTaq GoldやEx Taqといった他の酵素と比較して、どういった特徴があるでしょうか。) | ||
- | ・4班.三四郎池のメタゲノム | + | ・X班.三四郎池のメタゲノム |
検出されたバクテリアは淡水環境で良く検出されているでしょうか? | 検出されたバクテリアは淡水環境で良く検出されているでしょうか? | ||
- | 去年の三四郎池のデータとも比較してみる。http:// | + | 二年前の三四郎池のデータとも比較してみてください。http:// |
手法で詳しく説明して欲しい箇所:「ナノポアシーケンシング」(使用したライブラリー調整キットはSQK-LSK110です。公式マニュアル:http:// | 手法で詳しく説明して欲しい箇所:「ナノポアシーケンシング」(使用したライブラリー調整キットはSQK-LSK110です。公式マニュアル:http:// | ||
行 390: | 行 406: | ||
## G. 課題 | ## G. 課題 | ||
- | 明日のプレゼン資料の完成版をファイルに保存して、発表時に提出すること。 | + | 来週のプレゼン資料の完成版をファイルに保存して、発表時に提出すること。 |