両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン |
2017 [2017/10/23 04:19] – suikou | 2017 [2019/07/15 02:46] (現在) – 外部編集 127.0.0.1 |
---|
| |
データ解析の概要としては、rDNAのデータベースである[[https://www.arb-silva.de/|SILVA database]]に対して、Nanoporeのデータの相同性検索を行い、検索した結果をMEGANというツールで統合し、可視化する。 | データ解析の概要としては、rDNAのデータベースである[[https://www.arb-silva.de/|SILVA database]]に対して、Nanoporeのデータの相同性検索を行い、検索した結果をMEGANというツールで統合し、可視化する。 |
| |
| ## データの説明 |
| |
| ### 16S rDNAについて |
| |
| https://biology.stackexchange.com/questions/54823/what-causes-the-variable-conserved-structure-in-the-16s-rrna-gene |
| |
| 学生実習で使用したプライマー |
| |名前|配列| |
| |27F|AGAGTTTGATC(A/C)TGGCTCAG| |
| |1492R|GGTTACCTTGTTACGACTT| |
| |
| ### FASTQ形式について |
| |
| FASTQファイルをメモ帳などで開いてみると次のように表示される。 |
| |
| {{fastq.png}} |
| |
## 準備 | ## 準備 |
- 各班のシーケンスデータ | - 各班のシーケンスデータ |
| |
[[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/jissyu/|1]] | [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group1.1k.fastq|1]] |
| |
[[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/jissyu/|2]] | [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group2.1k.fastq|2]] |
| |
[[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/jissyu/|3]] | [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group3.1k.fastq|3]] |
| |
[[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/jissyu/|4]] | [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group4.1k.fastq|4]] |
| |
### シーケンスデータの説明 | ### シーケンスデータの説明 |
1. SILVA databaseの解凍 | 1. SILVA databaseの解凍 |
| |
SILVA_128_SSURef_Nr99_tax_silva.fasta.gzをダブルクリックすると解凍されるので、解凍された「SILVA_128_SSURef_Nr99_tax_silva.fasta」ファイルをデスクトップに移動する。 | SILVA_128_SSURef_Nr99_tax_silva.fasta.gzをダブルクリックすると解凍される(もしくはsafariでダウンロードしていたら自動で解凍されている)ので、解凍された「SILVA_128_SSURef_Nr99_tax_silva.fasta」ファイルをデスクトップに移動する。 |
| |
{{2007jissyu_4_.jpg}} | {{2007jissyu_4_.jpg}} |
> の後ろには出力ファイルの名前を書く。(拡張子はMEGANに読み込ませるために「.blastn」とすること) | > の後ろには出力ファイルの名前を書く。(拡張子はMEGANに読み込ませるために「.blastn」とすること) |
| |
1. MEGANによる結果表示 | --- |
| |
| ### BLASTについての説明 |
| |
| ■ 相同性検索について [[http://mlab.cb.k.u-tokyo.ac.jp/~mkasa/upbsb2006/upbsb_shotgun_day1.pdf|東大 新領域 情報生命 笠原先生の講義資料]]より |
| |
| {{aln1.png}} |
| |
| {{aln2.png}} |
| |
| {{aln3.png}} |
| |
| {{aln4.png}} |
| |
| ■ BLASTとは [[http://www.jst.go.jp/nbdc/bird/minicourses/blast-tutorial.pdf|JST HPより]] |
| |
| BLASTは、相同性検索(ホモ ロジーサーチ)を比較的高速に行うプログラムである。厳密な解を提供する Smith-Watermanアルゴリズムを少しヒューリスティックにすることで、完全な厳密解は与えないものの実用的には十分な精度を持ちつつ、 Smith-Watermanよりはるかに高速に検索を実現した。 また、BLASTではペアワイズの相同性検索の結果に対して、偶然そのような配列の一致が起こる期待値e-valueを出力し、閾値以上でデータベースとヒットした結果を出力する。 |
| |
| BLASTでは、問い合わせ配列とデータベース配列の組み合わせから、次の5種類が用意されている。 |
| |プログラム名|query|db|| |
| |blastn|DNA|DNA|| |
| |blastp|protein|protein|| |
| |blastx|DNA|protein|(DNAはアミノ酸に翻訳して比較)| |
| |tblastn|protein|DNA|(DNAはアミノ酸に翻訳して比較)| |
| |tblastx|DNA|DNA|(DNAはアミノ酸に翻訳して比較)| |
| |
| Blastの結果についての説明 |
| https://www.jaici.or.jp/stn/pdf/seqfaq.pdf |
| |
| {{2017jissyu_2_.jpg}} |
| |
| --- |
| |
| 5. MEGANによる結果表示 |
| |
MEGANではLowest Common Ancestor (LCA)法によって最もらしい元配列を推測している。LCA法の説明は[[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1800929/figure/F2/|こちら]] | MEGANではLowest Common Ancestor (LCA)法によって最もらしい元配列を推測している。LCA法の説明は[[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1800929/figure/F2/|こちら]] |
| |
| まずはMEGANを起動する。 |
| |
{{2007jissyu_22_.jpg}} | {{2007jissyu_22_.jpg}} |
| |
| 次にBLAST結果ファイルをMEGANで開く。 |
| |
{{2007jissyu_23_.jpg}} | {{2007jissyu_23_.jpg}} |
| |
{{2007jissyu_24_.jpg}} | 解析が終わっていない人、もしくはほかの班のデータも見たい人は以下のリンクから各班のBLAST結果をダウンロード可能。 |
| |
| [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group1.1k.fasta.blastn.gz|1]] |
| |
| [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group2.1k.fasta.blastn.gz|2]] |
| |
| [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group3.1k.fasta.blastn.gz|3]] |
| |
| [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group4.1k.fasta.blastn.gz|4]] |
| |
| {{2017jissyu_10_.jpg}} |
| |
| {{2017jissyu_9_.jpg}} |
| |
| LCAのパラメータを変更する場合は、ここで変更する。(後からでも変更可能) |
| |
{{2007jissyu_25_.jpg}} | {{2007jissyu_25_.jpg}} |
| |
| 結果が表示される。 |
| |
{{2007jissyu_26_.jpg}} | {{2007jissyu_26_.jpg}} |
| |
| 種名まで表示するために、表示するRankを変更する。 |
| |
{{2007jissyu_27_.jpg}} | {{2007jissyu_27_.jpg}} |
| |
{{2007jissyu_28_.jpg}} | {{2007jissyu_28_.jpg}} |
| |
| 6.MEGANで複数サンプルの比較 |
| |
| blastnファイルを複数回開いたら、開いたウィンドウをそのままにした状態で、「File」→「Compare」とクリックして比較したいサンプルを選択し、「Apply」をクリックする。 |
| |
| {{megan-c1.jpg}} |
| |
| 比較ウィンドウを開くと、とりあえず下記のように表示される。 |
| |
| {{megan-c2.jpg}} |
| |
| 表示形式を変更したりすると下記のように表示される。 |
| |
| {{megan-c3.jpg}} |
| |
| ExcelやR等で解析する場合は、データをタブ区切りテキスト形式でExportする。Exportしたいノードをクリックして(全部Exportする場合は全部選択して)、「File」→「Export」→「CSV Format」をクリックする。 |
| |
| {{megan-c4.jpg}} |
| |
| Exportするデータを「taxonPath_to_count」に変更してみる。(ほかのデータでも勿論可) |
| |
| {{megan-c5.jpg}} |
| |
| {{megan-c6.jpg}} |
| |
| 7.Excelでの解析 |
| |
| ExportしたファイルをExcelで開くには、右クリックして「このアプリケーションで開く」→「Microsoft Excel」をクリックする。 |
| |
| {{excel1.jpg}} |
| |
| フィルターを使ってみたり、グラフを描いてみたりする。Excelでデータの概要を把握するのに役立つテクニックとして、条件付き書式を設定することで、データの大小を一目でわかるようにできたりする。 |
| |
| {{excel2.jpg}} |
| |
| ## Excelファイルの提出先 |
| |
| akyoshita@g.ecc.u-tokyo.ac.jp |
| |