差分
このページの2つのバージョン間の差分を表示します。
次のリビジョン | 前のリビジョン | ||
cds領域からfastaファイルを作成する [2018/05/30 02:01] – 作成 133.11.222.89 | cds領域からfastaファイルを作成する [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | ====== bedファイルの分割 ====== | ||
- | 魚種ごとのミトコンドリアCDS領域の位置情報は | ||
- | < | ||
- | NC_000860_Salvelinus_fontinalis 2843 3817 | ||
- | NC_000860_Salvelinus_fontinalis 4032 5080 | ||
- | NC_000860_Salvelinus_fontinalis 5472 7022 | ||
- | NC_000860_Salvelinus_fontinalis 7186 7876 | ||
- | NC_000860_Salvelinus_fontinalis 7952 8119 | ||
- | NC_000860_Salvelinus_fontinalis 8110 8792 | ||
- | </ | ||
- | という形式で保存した。しかし、それぞれの魚種のミトコンドリアCDSの配列を取ってきたいのでこのbed形式のファイルをそれぞれの魚で分けて保存したほうが都合がいい。そこで次のシェルスクリプトを書いた。(シェルスクリプトで書く必要はあまりなさそう) | ||
- | <code bash> | ||
- | #!/bin/bash | ||
- | cat ~/ | ||
- | cd ~/ | ||
- | |||
- | mkdir bed_raw | ||
- | |||
- | cat speciesName.tmp | while read line | ||
- | do | ||
- | cat ~/ | ||
- | done | ||
- | </ | ||
- | |||
- | ====== 分割したbedの編集 ====== | ||
- | |||
- | ここでかなり引っかかったが、'' | ||
- | |||
- | <code bash> | ||
- | #!/bin/bash | ||
- | |||
- | num=1 | ||
- | |||
- | cd ~/ | ||
- | mkdir bed_edit | ||
- | |||
- | for i in bed_raw/* | ||
- | do | ||
- | name=$(cat speciesName.tmp | awk -v rowN=$num ' | ||
- | queryName=$(cat ~/ | ||
- | spTmp=$(cat <(echo ${i##*/} | sed -e ' | ||
- | ((num++)) # | ||
- | cat $i | awk -v q=" | ||
- | # | ||
- | done | ||
- | </ | ||
- | |||
- | ====== 配列抜き出し ====== | ||
- | 編集したbedを用いて配列を抜き出す。 | ||
- | |||
- | <code bash> | ||
- | #!/bin/bash | ||
- | |||
- | cd ~/ | ||
- | |||
- | for i in tmp/ | ||
- | do | ||
- | nameTmp=$(echo ${i##*/} | sed -e ' | ||
- | seqkit subseq --id-ncbi --bed $i ~/ | ||
- | done >> mitCDSSeq.fa | ||
- | </ | ||
- | |||
- | ====== BLASTでフレームがずれてないか確認 ====== | ||
- | |||
- | bed形式は座標を0始まりにするとか少しややこしいので、抜き出した配列がフレームシフトしてないか心配。そこでblastxでアミノ酸レベルで相同性が取れているか確認する。 | ||
- | <code bash> | ||
- | [kijima.yusuke@m48 CDSseq]$ for i in ~/ | ||
- | |||
- | [kijima.yusuke@m48 splitBLAST]$ cat *.blast | wc -l | ||
- | 29355 | ||
- | [kijima.yusuke@m48 splitBLAST]$ cat ../ | ||
- | 36894 | ||
- | </ | ||
- | クエリーの7~8割は相同性が取れてるから一応大丈夫かな。一応transeqでアミノ酸配列に変換してからもう少しだけ確認する。 |