差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン | |||
accessionidからtaxonomypathへの変換 [2021/11/23 06:32] – 133.11.144.12 | accessionidからtaxonomypathへの変換 [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | ====== AccessionIDからTaxonomy Pathへの変換 ====== | ||
- | |||
- | AccessionID⇒Taxonomy IDへの変換、Taxonomy ID⇒Taxonomy Pathへの変換の2段階で変換を行う。 | ||
- | |||
- | ===== AccessionID⇒Taxonomy IDへの変換 ===== | ||
- | |||
- | ==== データのダウンロード ==== | ||
- | |||
- | [[ftp:// | ||
- | |||
- | 研究室のサーバを使用する場合は | ||
- | |||
- | / | ||
- | |||
- | にあるファイルを使用すればよい。 | ||
- | |||
- | |||
- | ==== 変換 ==== | ||
- | |||
- | echo $accessionID | awk -v accessionID=${accessionID} | ||
- | |||
- | nucl_gb.accession2taxid は以下のようなファイル。 | ||
- | |||
- | {{: | ||
- | |||
- | 1行目がAccessionID、3行目がTaxonomyIDである。awkで1行目が該当AccessionIDと一致する行を取得し、cutコマンドでTaxonomyIDを取得する。 | ||
- | |||
- | ===== Taxonomy ID-> | ||
- | |||
- | ==== データのダウンロード ==== | ||
- | |||
- | [[ftp:// | ||
- | |||
- | 研究室のサーバを使用する場合は、 | ||
- | |||
- | / | ||
- | |||
- | を使用すればよい。 | ||
- | |||
- | ==== 変換 ==== | ||
- | |||
- | awk -v taxID=$(cat) ' | ||
- | |||
- | ※AccessionID⇒TaxonomyIDの変換スクリプトとパイプでつないでいるものとする。 | ||
- | |||
- | names.dmp.sname.pathは以下のようなファイル | ||
- | |||
- | {{: | ||
- | |||
- | 1行目が該当TaxonomyIDと一致する行を取得し、2行目のTaxonomy PATHを取得する。 | ||
- | |||
- | |||
- | ===== ワンライナーで変換 ===== | ||
- | |||
- | 実際に使用したスクリプトはこちら。 | ||
- | |||
- | taxonomyPath=$(echo $accessionID | awk -v accessionID=${accessionID} | ||
- | |||
- | |||
- | |||
- | |||
- | |||