2017

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
2017 [2017/10/25 23:45] suikou2017 [2019/07/15 02:46] (現在) – 外部編集 127.0.0.1
行 52: 行 52:
 - 各班のシーケンスデータ - 各班のシーケンスデータ
  
- [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/jissyu/|1]]+ [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group1.1k.fastq|1]]
  
- [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/jissyu/|2]]+ [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group2.1k.fastq|2]]
  
- [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/jissyu/|3]]+ [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group3.1k.fastq|3]]
  
- [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/jissyu/|4]]+ [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group4.1k.fastq|4]]
  
 ### シーケンスデータの説明 ### シーケンスデータの説明
行 86: 行 86:
 1. SILVA databaseの解凍 1. SILVA databaseの解凍
  
- SILVA_128_SSURef_Nr99_tax_silva.fasta.gzをダブルクリックすると解凍されるので、解凍された「SILVA_128_SSURef_Nr99_tax_silva.fasta」ファイルをデスクトップに移動する。+ SILVA_128_SSURef_Nr99_tax_silva.fasta.gzをダブルクリックすると解凍される(もしくはsafariでダウンロードしていたら自動で解凍されている)ので、解凍された「SILVA_128_SSURef_Nr99_tax_silva.fasta」ファイルをデスクトップに移動する。
  
  {{2007jissyu_4_.jpg}}  {{2007jissyu_4_.jpg}}
行 197: 行 197:
  > の後ろには出力ファイルの名前を書く。(拡張子はMEGANに読み込ませるために「.blastn」とすること)  > の後ろには出力ファイルの名前を書く。(拡張子はMEGANに読み込ませるために「.blastn」とすること)
  
-1. MEGANによる結果表示+--- 
 + 
 +### BLASTについての説明 
 + 
 +■ 相同性検索について [[http://mlab.cb.k.u-tokyo.ac.jp/~mkasa/upbsb2006/upbsb_shotgun_day1.pdf|東大 新領域 情報生命 笠原先生の講義資料]]より 
 + 
 +{{aln1.png}} 
 + 
 +{{aln2.png}} 
 + 
 +{{aln3.png}} 
 + 
 +{{aln4.png}} 
 + 
 +■ BLASTとは [[http://www.jst.go.jp/nbdc/bird/minicourses/blast-tutorial.pdf|JST HPより]] 
 +  
 +BLASTは、相同性検索(ホモ ロジーサーチ)を比較的高速に行うプログラムである。厳密な解を提供する Smith-Watermanアルゴリズムを少しヒューリスティックにすることで、完全な厳密解は与えないものの実用的には十分な精度を持ちつつ、 Smith-Watermanよりはるかに高速に検索を実現した。 また、BLASTではペアワイズの相同性検索の結果に対して、偶然そのような配列の一致が起こる期待値e-valueを出力し、閾値以上でデータベースとヒットした結果を出力する。  
 + 
 +BLASTでは、問い合わせ配列とデータベース配列の組み合わせから、次の5種類が用意されている。  
 +|プログラム名|query|db|| 
 +|blastn|DNA|DNA|| 
 +|blastp|protein|protein|| 
 +|blastx|DNA|protein|(DNAはアミノ酸に翻訳して比較)| 
 +|tblastn|protein|DNA|(DNAはアミノ酸に翻訳して比較)| 
 +|tblastx|DNA|DNA|(DNAはアミノ酸に翻訳して比較)| 
 + 
 +Blastの結果についての説明 
 +https://www.jaici.or.jp/stn/pdf/seqfaq.pdf 
 + 
 +{{2017jissyu_2_.jpg}} 
 + 
 +--- 
 + 
 + 5. MEGANによる結果表示
  
  MEGANではLowest Common Ancestor (LCA)法によって最もらしい元配列を推測している。LCA法の説明は[[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1800929/figure/F2/|こちら]]  MEGANではLowest Common Ancestor (LCA)法によって最もらしい元配列を推測している。LCA法の説明は[[https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1800929/figure/F2/|こちら]]
行 209: 行 242:
  {{2007jissyu_23_.jpg}}  {{2007jissyu_23_.jpg}}
  
- {{2007jissyu_24_.jpg}}+ 解析が終わっていない人、もしくはほかの班のデータも見たい人は以下のリンクから各班のBLAST結果をダウンロード可能。 
 + 
 + [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group1.1k.fasta.blastn.gz|1]] 
 + 
 + [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group2.1k.fasta.blastn.gz|2]] 
 + 
 + [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group3.1k.fasta.blastn.gz|3]] 
 + 
 + [[http://www.suikou.fs.a.u-tokyo.ac.jp/yosh_data/2017jissyu/group4.1k.fasta.blastn.gz|4]] 
 + 
 + {{2017jissyu_10_.jpg}} 
 + 
 + {{2017jissyu_9_.jpg}}
  
  LCAのパラメータを変更する場合は、ここで変更する。(後からでも変更可能)  LCAのパラメータを変更する場合は、ここで変更する。(後からでも変更可能)
行 224: 行 269:
  
  {{2007jissyu_28_.jpg}}  {{2007jissyu_28_.jpg}}
 +
 + 6.MEGANで複数サンプルの比較
 +
 + blastnファイルを複数回開いたら、開いたウィンドウをそのままにした状態で、「File」→「Compare」とクリックして比較したいサンプルを選択し、「Apply」をクリックする。
 +
 + {{megan-c1.jpg}}
 +
 + 比較ウィンドウを開くと、とりあえず下記のように表示される。
 +
 + {{megan-c2.jpg}}
 +
 + 表示形式を変更したりすると下記のように表示される。
 +
 + {{megan-c3.jpg}}
 +
 + ExcelやR等で解析する場合は、データをタブ区切りテキスト形式でExportする。Exportしたいノードをクリックして(全部Exportする場合は全部選択して)、「File」→「Export」→「CSV Format」をクリックする。
 +
 + {{megan-c4.jpg}}
 +
 + Exportするデータを「taxonPath_to_count」に変更してみる。(ほかのデータでも勿論可)
 +
 + {{megan-c5.jpg}}
 +
 + {{megan-c6.jpg}}
 +
 + 7.Excelでの解析
 +
 + ExportしたファイルをExcelで開くには、右クリックして「このアプリケーションで開く」→「Microsoft Excel」をクリックする。
 +
 + {{excel1.jpg}}
 +
 + フィルターを使ってみたり、グラフを描いてみたりする。Excelでデータの概要を把握するのに役立つテクニックとして、条件付き書式を設定することで、データの大小を一目でわかるようにできたりする。
 + 
 + {{excel2.jpg}}
 +
 +## Excelファイルの提出先
 +
 +akyoshita@g.ecc.u-tokyo.ac.jp
  
  • 2017.1508975143.txt.gz
  • 最終更新: 2019/07/15 02:46
  • (外部編集)