差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン | |||
比較ゲノム解析トレーニング [2019/07/08 00:27] – [変換した配列の検査] 133.11.144.10 | 比較ゲノム解析トレーニング [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | ====== 概論 ====== | ||
- | 比較ゲノム解析はゲノム配列の生物種間の比較から特徴的な配列変化、遺伝子欠損や重複を見つけて考察する学問。 | ||
- | - ターゲットのの生物種がどれだけ独特の性質があるか | ||
- | - 比較の基準にする生物種がどれだけターゲットと近縁か | ||
- | この辺が鍵になる。つまり、近縁かつノーマルな形質を持った種を比較対象とすること、そしてターゲットの種がどれだけユニークな形質を持っているかが大事。比較対象の選定には一番気を使うべき。コントロールの種は多ければ多いほど理想的。 | ||
- | ==== 進化論的なアプローチ ==== | ||
- | |||
- | 中立説(木村資生, | ||
- | |||
- | branch-siteモデルを使うと一塩基単位で正の自然選択を受けた箇所を出してくれるので、その変異が主要なドメインに入っているか、とか立体構造に影響を及ぼすか、みたいな議論までできると強い。 | ||
- | |||
- | ただ進化論的なアプローチなしで議論を完結させている論文も多くあるので、ちゃんと文献を読んで解析の手札を増やすのが大事(反省)。 | ||
- | |||
- | ==== 配列欠損などから議論 ==== | ||
- | |||
- | もっとシンプルに特定の遺伝子の有無から議論する。まずはこっちでいいと思う。配列比較からターゲットの種だけに存在する、もしくは欠損する遺伝子を抽出し、その機能を確かめる。ゲノム上で隣り合ってたりしたらシンテニーブロックを描いてみると伝わりやすい。 | ||
- | |||
- | ====== 何はともあれ練習 ====== | ||
- | |||
- | 随時更新予定。 | ||
- | |||
- | ==== 配列情報の取得 ==== | ||
- | |||
- | 以下チャレンジしてみよう | ||
- | * NCBI genomesよりゼブラフィッシュ, | ||
- | * それぞれcDNAの数をカウント、コイとキンギョはゼブラフィッシュからゲノム倍化しているという説が確かめられるかチェック | ||
- | * アミノ酸配列はスプライシングバリアントの情報を含んでおり邪魔なので、一つの遺伝子にまとめる。ネット上でgene2accessionというファイルを探してきて、この情報を元にfastaのヘッダーをGENE IDに変えてやるといいと思います。 | ||
- | * GENE IDに統一できたらバリアントが同じ遺伝子IDになるはずなので、同一遺伝子IDで最も配列長が長いものを代表遺伝子として保存する。 | ||
- | * 以上の作業を行う上でseqkitというツールが役に立つと思います。あとはawkでゴリ押しすれば大丈夫。これを機にpythonとか勉強してみるのもいいかも? | ||
- | |||
- | ==== 配列比較 ==== | ||
- | |||
- | * コイ、キンギョ、ゼブラに対し変換したfastaの中の遺伝子数をチェック。多分コイとキンギョでゲノム倍加してるのがもっともらしいという印象が得られると思う。 | ||
- | * まずは最初数ヘッダーをblastする。練習。 | ||
- | * Grid engineを用いてall vs allのblastを実行。互いにトップヒットとなった遺伝子ペアのみ抽出。 |