配列中の任意の文字の出現割合を集計

seqkitを用いた文字出現割合の集計

fastaファイルの配列にどの文字がどれくらいの割合で出現するかカウントするとき、ここでもseqkitが使える。

cat <(echo -e Name\\tAla\\tArg\\tAsn\\tAsp\\tCys\\tGln\\tGlu\\tGly\\tHis\\tIle\\tLeu\\tLys\\tMet\\tPhe\\tPro\\tSer\\tThr\\tTrp\\tTyr\\tVal\\tunknown\\tTerminal) <(cat mitCDSSeqFrameProt.fa | sed -e 's/ /_/g' | seqkit fx2tab -nB A,R,N,D,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V,X,"*") > aminoContentEachGene.txt

ここではミトコンドリアCDSのアミノ酸配列に対し各残基が出現する割合をseqkitのfx2tabにより求めている。

  • 配列中の任意の文字の出現割合を集計.1527671109.txt.gz
  • 最終更新: 2018/05/30 09:05
  • by 157.82.194.14