差分
このページの2つのバージョン間の差分を表示します。
| 両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
| 2025 [2025/11/07 02:38] – [シーケンス結果(配布ファイル)] suikou | 2025 [2025/11/07 15:08] (現在) – [4. コンセンサス配列の生物種名を調べる] suikou | ||
|---|---|---|---|
| 行 33: | 行 33: | ||
| PCR増幅したプライマーの種類 | PCR増幅したプライマーの種類 | ||
| - | |サンプル|プライマー領域|対象生物|アダプターの付いたPCR断片長| | + | |サンプル|プライマー名、配列|増幅する領域|対象生物|PCR断片長| |
| - | |三四郎池の水|ミトコンドリア12S rRNA|魚|200 bp強(300 bp強にバクテリア由来の非特異的なバンドも増えることが多い)| | + | |三四郎池の水|MiFish-U-F: |
| - | |三四郎池の水|バクテリア16S rRNA|バクテリア|1, | + | |三四郎池の水|27F: AGAGTTTGATCMTGGCTCAG, |
| - | |発酵食品|バクテリア16S rRNA|バクテリア|1, | + | |発酵食品|27F: AGAGTTTGATCMTGGCTCAG, |
| + | |||
| + | 皆さんが実際に使用したのは、上記のプライマーの配列にサンプルを区別するためのバーコード配列がついたものを使用しています。この後配布するシーケンスデータは、上記のプライマーやバーコード部分をトリミング(削除)してあります。 | ||
| --- | --- | ||
| 行 121: | 行 123: | ||
| | 出典:https:// | | 出典:https:// | ||
| - | |||
| - | ### 使用したプライマー | ||
| - | |||
| - | - バクテリア16S全長 プライマー部分を除くと1, | ||
| - | |プライマーの名前|配列| | ||
| - | |バクテリア16S全長 Forward (27F)|AGAGTTTGATCMTGGCTCAG| | ||
| - | |バクテリア16S全長 Reverse (1492R)|GGTTACCTTGTTACGACTT| | ||
| - | |||
| - | - ミトコンドリア12S MiFish プライマー部分を除くと170 bp程度のDNA断片 | ||
| - | |プライマーの名前|配列| | ||
| - | |ミトコンドリア12S MiFish Forward (MiFish-U-F)|GTCGGTAAAACTCGTGCCAGC| | ||
| - | |ミトコンドリア12S MiFish Reverse (MiFish-U-R)|CATAGTGGGGTATCTAATCCCAGTTTG| | ||
| - | |||
| - | 皆さんに配布するシーケンスデータはナノポアのアダプターや上記のプライマー部分をトリミング(削除)してあります。 | ||
| ### 同種、同属、同科での配列の一致率の閾値 | ### 同種、同属、同科での配列の一致率の閾値 | ||
| 行 231: | 行 219: | ||
| https:// | https:// | ||
| + | |||
| + | TGTTACGGとTGCTAAGGのアライメントを考える。 | ||
| {{: | {{: | ||
| + | |||
| + | 最良のアライメント結果は | ||
| + | |||
| + | ``` | ||
| + | TGTTACGG | ||
| + | ||X||X|| | ||
| + | TGCTAAGG | ||
| + | ``` | ||
| ## 相同性検索を高速に行うBLASTプログラム | ## 相同性検索を高速に行うBLASTプログラム | ||
| 行 348: | 行 346: | ||
| ## 2. クラスタリング | ## 2. クラスタリング | ||
| + | |||
| + | 最初に… | ||
| + | |||
| + | ``` | ||
| + | pip3 install pandas | ||
| + | ``` | ||
| a. まずeDNA、メタゲノムごとにシーケンスデータをひとつのファイルにまとめる。ここではeDNAの場合を説明する。 | a. まずeDNA、メタゲノムごとにシーケンスデータをひとつのファイルにまとめる。ここではeDNAの場合を説明する。 | ||
| 行 432: | 行 436: | ||
| ``` | ``` | ||
| - | 上記は魚の12S rRNA配列のデータベースなので、メタゲノムの場合は下記の通りSILVAのデータベースを使用する。 | + | 上記は魚の12S rRNA配列のデータベースで、元千葉県立中央博物館の宮博士、佐土博士らによってメンテナンスされているデータベース。メタゲノムの場合は下記の通りSILVAのデータベースを使用する。 |
| Windows | Windows | ||
| 行 465: | 行 469: | ||
| python3 deduplicate_abundance.py abundance_normalized.tsv | python3 deduplicate_abundance.py abundance_normalized.tsv | ||
| ``` | ``` | ||
| + | |||
| + | その他調べてみてほしいこととして、最初のシーケンスデータのリード数を確認したり、クラスタリング等を行うたびにどのくらいの数の配列に集約されていったのかを調べてみてほしい。また、可能ならコンセンサス配列のもとになったナノポアのシーケンスデータを抽出して、コンセンサス配列とすることでシーケンスエラーが除去できている様子をマルチプルアライメントを作成して確認してみて。 | ||
| ### コマンド入力時の便利キー | ### コマンド入力時の便利キー | ||