2023-メタゲノム・edna

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
2023-メタゲノム・edna [2023/11/08 08:33] suikou2023-メタゲノム・edna [2023/11/09 00:57] (現在) suikou
行 54: 行 54:
 ### 1. ツールのインストール ### 1. ツールのインストール
  
-これからダウンロードするファイルを入れるディレクトリを作成し、その中にすべてのファイルをダウンロードする。とりあえずここではWindowsでダウンロードフォルダの中に「2023jissyu」というフォルダを作ったとします。(注意:今回使用するプログラムはフォルダ名が日本語になっていると正常動作しません。もし「C:\Users\XXX\ダウンロード\2023jissyu」などとパスに日本語が含まれる場合は、「C:\2023jissyu」など途中に日本語フォルダを挟まないフォルダを作ってその中にダウンロードして下さい。OneDriveなどと同期させていない場合は、おそらく「C:\Users\XXX\Downloads\2023jissyu」になっているはずなので、特に気にしなくて良いはずです。)+これからダウンロードするファイルを入れるディレクトリを作成し、その中にすべてのファイルをダウンロードする。とりあえずここではWindowsでダウンロードフォルダの中に「2023jissyu」というフォルダを作ったとします。(注意:今回使用するプログラムはフォルダ名が日本語になっていると正常動作しません。もし「C:\Users\XXX\Downloads\東大学生実験\2023jissyu」などとパスに日本語が含まれる場合は、「C:\Users\XXX\Downloads\2023jissyu」など途中に日本語フォルダを挟まないフォルダを作ってその中にダウンロードして下さい。OneDriveでダウンロードフォルダを同期させていると「C:\Users\XXX\ダウンロードと日本語になっていることもあるので注意。)
  
 - SeqKit - SeqKit
行 62: 行 62:
  Windowsは「Windows amd64」の「`seqkit_windows_amd64.exe.tar.gz`」、Mac (Intel)は「`seqkit_darwin_amd64.tar.gz`」、Mac (M1, M2)は「`seqkit_darwin_arm64.tar.gz`」、Linuxは「`seqkit_linux_amd64.tar.gz`」をダウンロードする。  Windowsは「Windows amd64」の「`seqkit_windows_amd64.exe.tar.gz`」、Mac (Intel)は「`seqkit_darwin_amd64.tar.gz`」、Mac (M1, M2)は「`seqkit_darwin_arm64.tar.gz`」、Linuxは「`seqkit_linux_amd64.tar.gz`」をダウンロードする。
  
- WindowsではPowerShellなどをターミナルを開き、下記コマンド実行する。(Mac、Linuxでも基本的は同じtarコマンドを使う。ディレクトリやファイルの名前が違うと思うのでそれぞれ変更すること+ WindowsではスタートメニューからPowerShellを起動してターミナルを開く。MacではLaunchpad→そ他→ターミナル起動する。 
 + 
 + ターミナル下記のコマンドを入力し、seqkitを解凍する。
  
 ``` ```
行 76: 行 78:
  https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.12.0/  https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.12.0/
  
- Windowsは「`ncbi-blast-2.12.0+-x64-win64.tar.gz`」をダウンロードする。+ Windowsは「`ncbi-blast-2.12.0+-x64-win64.tar.gz`」を、Macは「`ncbi-blast-2.12.0+-x64-macosx.tar.gz`」ダウンロードし、「2023jissyu」フォルダに移した後で、下記のコマンドを実行する。
  
 ``` ```
 #ダウンロードしたファイルを解凍する。 #ダウンロードしたファイルを解凍する。
 +## Windows
 tar vxf ncbi-blast-2.12.0+-x64-win64.tar.gz tar vxf ncbi-blast-2.12.0+-x64-win64.tar.gz
 +
 +## Mac
 +tar vxf ncbi-blast-2.12.0+-x64-macosx.tar.gz 
 ``` ```
  
行 87: 行 93:
  https://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc  https://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc
  
- Windowsは「FastQC vX.XX.X (Win/Linux zip file)」をダウンロードする。 
-  
  {{:pasted:20221105-180123.png}}  {{:pasted:20221105-180123.png}}
-  
- 各自OSの機能でzipファイルを解凍する。 
  
 + Windowsは「FastQC vX.XX.X (Win/Linux zip file)」をダウンロードし、「2023jissyu」フォルダに移した後で、下記のコマンドを実行する。
 +
 +```
 +Expand-Archive -Path fastqc_v0.12.1.zip -DestinationPath .
 +```
 +
 + Macは「FastQC vX.XX.X (Mac DMG image)」をダウンロードし、ダブルクリックしてイメージをマウントしておく。
 + 
 - MEGAN - MEGAN
  
行 111: 行 121:
 {{:pasted:20231107-050521.png?600}} {{:pasted:20231107-050521.png?600}}
  
- Macは「`MEGAN_Community_macos_6_XX_X.dmg`」をダウンロードし、ダウンロードしたファイルをクリックorダブルクリックしてディスクイメージをマウントし、インストーラーをダブルクリックして起動する。+ Macは「`MEGAN_Community_macos_6_XX_X.dmg`」をダウンロードし、ダウンロードしたファイルをダブルクリックしてディスクイメージをマウントし、インストーラーをダブルクリックして起動する。
  
 {{:pasted:20231107-070534.png?600}} {{:pasted:20231107-070534.png?600}}
行 121: 行 131:
 ### 2. データベースのダウンロード ### 2. データベースのダウンロード
  
-- 16S rRNA、18S rRNA、ミトコンドリア、葉緑体等のメタバーコーディングで使用される領域をまとめたFASTAファイルをダウンロードして各自OSの機能でzipファイルを解凍する+- 16S rRNA、18S rRNA、ミトコンドリア、葉緑体等のメタバーコーディングで使用される領域をまとめたFASTAファイルをダウンロードして各自OSの機能でzipファイルを解凍し、中身の`silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta`を「2023jissyu」フォルダにコピーしておく
  
 [[http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2023jissyu/silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta.zip]] [[http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2023jissyu/silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta.zip]]
行 143: 行 153:
  [[http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2023jissyu/2023nanopore.zip]]  [[http://suikou.fs.a.u-tokyo.ac.jp/yosh_data/2023jissyu/2023nanopore.zip]]
    
- zipファイルを解凍しておく。本当は各サンプ2万リードほど読めていたけど、全部blastかけると時間がかかるので、1000リドずつ抽出している+ zipファイルを解凍し、中身のgroupX_XXX.fqファイを「2023jissyu」フォルダコピーしておく
    
  ・ eDNA解析: groupX-fish-water.fqのファイルを使用  ・ eDNA解析: groupX-fish-water.fqのファイルを使用
行 232: 行 242:
 ``` ```
 #Blastデータベースを作成 #Blastデータベースを作成
-./ncbi-blast-2.12.0+/bin/makeblastdb -in silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07/silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta -dbtype nucl+./ncbi-blast-2.12.0+/bin/makeblastdb -in silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta -dbtype nucl
 ``` ```
  
行 244: 行 254:
  
 ``` ```
-./ncbi-blast-2.12.0+/bin/blastn -db silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07/silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta -query input.fasta -num_threads 16 -out input.fasta.blastn+./ncbi-blast-2.12.0+/bin/blastn -db silva-SSU-LSU_PR2_NCBI-16S-mito-plastid_2023-04-18_rename_mitofish-2023-11-07.fasta -query input.fasta -num_threads 16 -out input.fasta.blastn
 ``` ```
  
行 292: 行 302:
 {{:pasted:20201026-182612.png}} {{:pasted:20201026-182612.png}}
  
-5.「LCA Params」タブを開いて、Top Percent: の値を0.5に変更しておきます。このパラメータは、BLASTの結果の中で最もスコアの高いトップヒットからどの程度離れたヒットまで使用するかの閾値になります。ナノポアではシーケンス精度が悪く、無関係な生物も似たようなスコアでヒットしてしまうため、ほぼトップヒットしか使わないように厳しめに閾値を設定しておきます。それから、Min Score: の値をバクテリア16Sではリード長が1500bp程度なので1000、魚類16Sではリード長が600bp程度なので300、魚類12Sではリード長が200bp程度なので100などと指定し、スコアの低いリードをトリミングします。+5.「LCA Params」タブを開いて、Top Percent: の値を0.5に変更しておきます。このパラメータは、BLASTの結果の中で最もスコアの高いトップヒットからどの程度離れたヒットまで使用するかの閾値になります。ナノポアではシーケンス精度が悪く、無関係な生物も似たようなスコアでヒットしてしまうため、ほぼトップヒットしか使わないように厳しめに閾値を設定しておきます。それから、Min Score: の値をバクテリア16Sではリード長が1500bp程度なので1000、魚類16Sではリード長が600bp程度なので300、魚類12Sではリード長が200bp程度なので100などと指定し、スコアの低いリードをトリミングします。「Apply」を押すとファイルを読み込みます。
  
 {{:pasted:20201026-182626.png}} {{:pasted:20201026-182626.png}}
  • 2023-メタゲノム・edna.1699432431.txt.gz
  • 最終更新: 2023/11/08 08:33
  • by suikou