差分
このページの2つのバージョン間の差分を表示します。
次のリビジョン | 前のリビジョン | ||
fastaファイルから欲しい配列のみ抜き出す [2018/05/08 12:28] – 作成 133.11.222.89 | fastaファイルから欲しい配列のみ抜き出す [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | ====== fastaファイルから欲しい配列を抜き出す ====== | ||
- | |||
- | fastaファイルの中には | ||
- | < | ||
- | > | ||
- | TCTGGACTAC | ||
- | > | ||
- | GATTGGGGTAC | ||
- | > | ||
- | GCCACGCCCCCTGATATAAATAAAGCAGATTGGGTTCCTCATCTTAATCTCCTCGTTGGA | ||
- | TCTAGACTGATATACAGCAATGGTGTGTTTATTAATTTCAGCAATGTTGATGGGTAAGTG | ||
- | TTACTGCACTAAAAATACCTTAATCATGCACAATTATGATCTTTAAAAACAGATTTTGTG | ||
- | GGGCAATGTATTGTATGATTCTAGGATTTTAAATAAAACATGTTATTTCTCTGGATTTTA | ||
- | GGTTTGCTTTCACTTGTCAAATCTTCTCAGATAGTCAATATATCAGCTCAACCAGGAAAA | ||
- | </ | ||
- | のように配列中に改行が含まれるものがある。この場合欲しい配列が'' | ||
- | <code bash> | ||
- | seqkit grep -p " | ||
- | </ | ||
- | これで | ||
- | < | ||
- | > | ||
- | GAGTTGTGTACGTTTGGCTGACCGTACGCAGGCTAAGAGTGCTAATAGACTTTTGATTTA | ||
- | ATAGGCATATTCTCACCTTTGTTTACATACGTGTGCTCACGAGAGACAGATGAGTGTGAA | ||
- | CTGGCGAACATGTGTGTGTGTTTGAATTAAAGCCAGGAAAAGGGGAAGGGCTTCGAGTGA | ||
- | GCGAACAAAAACAGCTGCCTCTTGTGTGCTCGGGAAACCTCATCCAGAGAGAGGGAGAGA | ||
- | GAAGAGACGGACCAGCAGGGTCCAGGCCTCTATATGGGTTGCGCCTTGAGTGGGGATAGC | ||
- | ... | ||
- | </ | ||
- | のようにほしい配列をキーワード指定で抜いてこれた。まあ少し考えればawkでできそうだけど。 | ||
- | ちなみにseqkitはいろいろな機能があり、こんな感じ。文字列処理に慣れてないうちは楽かも。 | ||
- | < | ||
- | [kijima.yusuke@m48 OnlyDNAHit_CI01000021]$ seqkit -h | ||
- | SeqKit -- a cross-platform and ultrafast toolkit for FASTA/Q file manipulation | ||
- | |||
- | Version: 0.7.3-dev | ||
- | |||
- | Author: Wei Shen < | ||
- | |||
- | Documents | ||
- | Source code: https:// | ||
- | Please cite: https:// | ||
- | |||
- | Suggestion : Install pigz to gain better parsing performance for gzipped data | ||
- | |||
- | Usage: | ||
- | seqkit [command] | ||
- | |||
- | Available Commands: | ||
- | common | ||
- | concat | ||
- | convert | ||
- | duplicate | ||
- | faidx | ||
- | fq2fa | ||
- | fx2tab | ||
- | genautocomplete generate shell autocompletion script | ||
- | grep search sequences by pattern(s) of name or sequence motifs | ||
- | head print first N FASTA/Q records | ||
- | help Help about any command | ||
- | locate | ||
- | range print FASTA/Q records in a range (start:end) | ||
- | rename | ||
- | replace | ||
- | restart | ||
- | rmdup | ||
- | sample | ||
- | seq | ||
- | shuffle | ||
- | sliding | ||
- | sort sort sequences by id/ | ||
- | split split sequences into files by id/seq region/ | ||
- | stats | ||
- | subseq | ||
- | tab2fx | ||
- | version | ||
- | |||
- | Flags: | ||
- | --alphabet-guess-seq-length int | ||
- | -h, --help | ||
- | --id-ncbi | ||
- | --id-regexp string | ||
- | -w, --line-width int line width when outputing FASTA format (0 for no wrap) (default 60) | ||
- | -o, --out-file string | ||
- | --quiet | ||
- | -t, --seq-type string | ||
- | -j, --threads int | ||
- | |||
- | Use " | ||
- | </ | ||
- | |||
- | |||