blastあれこれ

BLASTの-outfmtの種類一覧

ヘルプで見ろって話なんだけど不精なのでまとめておく。引用:http://d.hatena.ne.jp/aaikmyz/20110320/1300605293

0 = pairwise,
1 = query-anchored showing identities,
2 = query-anchored no identities,
3 = flat query-anchored, show identities,
4 = flat query-anchored, no identities,
5 = XML Blast output,
6 = tabular,
7 = tabular with comment lines,
8 = Text ASN.1,
9 = Binary ASN.1,
10 = Comma-separated values,
11 = BLAST archive format (ASN.1)

タブ区切りで出力してくれるoutfmt 6をよく使う。アライメント状況とかを見たいときはデフォルト(0)で。

outfmt6で出力した表の見方

outfmtに6を指定して出力したリザルトは

qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore

という並びになっている。

意味は

qseqid	クエリの配列名
sseqid	検索対象の配列名
pident	Percentage of identical matches
length	アラインメントの長さ
mismatch	アラインメントのミスマッチ数
gapopen	ギャップの開始位置の数
qstart	クエリの中のアラインメントの開始位置
sstart	検索対象の配列のアライメントの開始位置
send	検索対象の配列のアラインメントの終了位置
evalue	E-value
bitscore	Bit score

また、outfmtに7を指定すると好みの値のみ取ってくることができる。使えるパラメータは以下の通り(これも引用)

qgi	Query GI
qacc	Query accesion
qaccver	Query accesion.version
sseqid	検索対象の配列名
sallseqid	All subject Seq-id(s), separated by a ';'
sgi	Subject GI
sallgi	All subject GIs
sacc	Subject accession
saccver	Subject accession.version
sallacc	All subject accessions
qend	クエリの中のアラインメントの終了位置
qseq	クエリのアラインメント配列
sseq	検索対象のアラインメント配列
score	Raw score
nident	Number of identical matches
positive	Number of positive-scoring matches
gaps	ギャップ数
ppos	マッチの割合%
frames	Query and subject frames separated by a '/'
qframe	Query frame
sframe	Subject frame
btop	Blast traceback operations (BTOP)

e-valueとアライメントの感覚をつかむ

相同性検索をするとき閾値をどの程度にすれば相同性があると判断してよいか迷う。ここにe-valueの値に対するアライメント結果を載せておくので判断の一助に使うとよいかもしれない。

#################
##e-value=3e-15##
#################

Score = 70.1 bits (170),  Expect = 3e-15, Method: Compositional matrix adjust.
 Identities = 40/114 (35%), Positives = 63/114 (55%), Gaps = 6/114 (5%)

Query  3    RTIYCILFLTYFWGCDCAESVDQNTRVETAVEGGSVTINCTYQTSDPSPYLFWYQQKPNT  62
            R +  IL+L   W     + V+QN+   +  EG   ++NCTY +   S   FWY+Q
Sbjct  5    RVLLVILWLQLSWVWSQQKEVEQNSGPLSVPEGAIASLNCTY-SDRGSQSFFWYRQYSGK  63

Query  63   IPKYMMMIFATTVQNDKDFEEERFSAKHDKTLKSVPLLIQDLRVSDSAVYYCAL  116
             P+ +M I++     + D E+ RF+A+ +K  + V LLI+D + SDSA Y CA+
Sbjct  64   SPELIMFIYS-----NGDKEDGRFTAQLNKASQYVSLLIRDSQPSDSATYLCAV  112

e-value=e-15程度だとかなり弱いアライメントのようで、用途を選びそう。(どういう用途で使えるのかは知らん)

  • blastあれこれ.1527148081.txt.gz
  • 最終更新: 2018/05/24 07:48
  • by 133.11.222.89