**文書の過去の版を表示しています。**
BLASTの-outfmtの種類一覧
ヘルプで見ろって話なんだけど不精なのでまとめておく。引用:http://d.hatena.ne.jp/aaikmyz/20110320/1300605293
0 = pairwise, 1 = query-anchored showing identities, 2 = query-anchored no identities, 3 = flat query-anchored, show identities, 4 = flat query-anchored, no identities, 5 = XML Blast output, 6 = tabular, 7 = tabular with comment lines, 8 = Text ASN.1, 9 = Binary ASN.1, 10 = Comma-separated values, 11 = BLAST archive format (ASN.1)
タブ区切りで出力してくれるoutfmt 6をよく使う。アライメント状況とかを見たいときはデフォルト(0)で。
outfmt6で出力した表の見方
outfmtに6を指定して出力したリザルトは
qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore
という並びになっている。
意味は
qseqid クエリの配列名 sseqid 検索対象の配列名 pident Percentage of identical matches length アラインメントの長さ mismatch アラインメントのミスマッチ数 gapopen ギャップの開始位置の数 qstart クエリの中のアラインメントの開始位置 sstart 検索対象の配列のアライメントの開始位置 send 検索対象の配列のアラインメントの終了位置 evalue E-value bitscore Bit score
また、outfmtに7を指定すると好みの値のみ取ってくることができる。使えるパラメータは以下の通り(これも引用)
qgi Query GI qacc Query accesion qaccver Query accesion.version sseqid 検索対象の配列名 sallseqid All subject Seq-id(s), separated by a ';' sgi Subject GI sallgi All subject GIs sacc Subject accession saccver Subject accession.version sallacc All subject accessions qend クエリの中のアラインメントの終了位置 qseq クエリのアラインメント配列 sseq 検索対象のアラインメント配列 score Raw score nident Number of identical matches positive Number of positive-scoring matches gaps ギャップ数 ppos マッチの割合% frames Query and subject frames separated by a '/' qframe Query frame sframe Subject frame btop Blast traceback operations (BTOP)
e-valueとアライメントの感覚をつかむ
相同性検索をするとき閾値をどの程度にすれば相同性があると判断してよいか迷う。ここにe-valueの値に対するアライメント結果を載せておくので判断の一助に使うとよいかもしれない。
################# ##e-value=1e-15## ################# Score = 70.1 bits (170), Expect = 3e-15, Method: Compositional matrix adjust. Identities = 40/114 (35%), Positives = 63/114 (55%), Gaps = 6/114 (5%) Query 3 RTIYCILFLTYFWGCDCAESVDQNTRVETAVEGGSVTINCTYQTSDPSPYLFWYQQKPNT 62 R + IL+L W + V+QN+ + EG ++NCTY + S FWY+Q Sbjct 5 RVLLVILWLQLSWVWSQQKEVEQNSGPLSVPEGAIASLNCTY-SDRGSQSFFWYRQYSGK 63 Query 63 IPKYMMMIFATTVQNDKDFEEERFSAKHDKTLKSVPLLIQDLRVSDSAVYYCAL 116 P+ +M I++ + D E+ RF+A+ +K + V LLI+D + SDSA Y CA+ Sbjct 64 SPELIMFIYS-----NGDKEDGRFTAQLNKASQYVSLLIRDSQPSDSATYLCAV 112
e-value=1e-15程度だとかなり弱いアライメントのようで、用途を選びそう。(どういう用途で使えるのかは知らん)