**文書の過去の版を表示しています。**
seqkitを用いた文字出現割合の集計
fastaファイルの配列にどの文字がどれくらいの割合で出現するかカウントするとき、ここでもseqkitが使える。
cat <(echo -e Name\\tAla\\tArg\\tAsn\\tAsp\\tCys\\tGln\\tGlu\\tGly\\tHis\\tIle\\tLeu\\tLys\\tMet\\tPhe\\tPro\\tSer\\tThr\\tTrp\\tTyr\\tVal\\tunknown\\tTerminal) <(cat mitCDSSeqFrameProt.fa | sed -e 's/ /_/g' | seqkit fx2tab -nB A,R,N,D,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V,X,"*") > aminoContentEachGene.txt
ここではミトコンドリアCDSのアミノ酸配列に対し各残基が出現する割合をseqkitのfx2tabにより求めている。