accessionidからtaxonomypathへの変換

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
accessionidからtaxonomypathへの変換 [2021/11/23 06:30] 133.11.144.12accessionidからtaxonomypathへの変換 [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1
行 1: 行 1:
-====== AccessionIDからTaxonomy Pathへの変換 ====== 
- 
-AccessionID⇒Taxonomy IDへの変換、Taxonomy ID⇒Taxonomy Pathへの変換の2段階で変換を行う。 
- 
-===== AccessionID⇒Taxonomy IDへの変換 ===== 
- 
-==== データのダウンロード ==== 
- 
-[[ftp://ftp.ncbi.nih.gov/pub/taxonomy/accession2taxid/]] から''nucl_gb.accession2taxid.gz'' をダウンロード 
- 
-研究室のサーバを使用する場合は 
- 
-/suikou/db/ncbi/2021-08-10_accession2taxid/nucl_gb.accession2taxid.gz 
- 
-にあるファイルを使用すればよい。 
- 
- 
-==== 変換 ==== 
- 
-    echo $accessionID | awk  -v accessionID=${accessionID}  '{if($1==accessionID){print $0}}' nucl_gb.accession2taxid |cut -f 3  
- 
-nucl_gb.accession2taxid は以下のようなファイル。 
- 
-{{:pasted:20211123-152306.png}} 
- 
-1行目がAccessionID、3行目がTaxonomyIDである。awkで1行目が該当AccessionIDと一致する行を取得し、cutコマンドでTaxonomyIDを取得する。 
- 
-===== Taxonomy ID->Taxonomy PATHの変換 ===== 
- 
-==== データのダウンロード ==== 
- 
-[[ftp://ftp.ncbi.nih.gov/pub/taxonomy/taxdump.tar.gz]] からダウンロード 
- 
-研究室のサーバを使用する場合は、 
- 
-/suikou/db/ncbi/2021-06-01_taxdump/names.dmp.sname.path 
- 
-を使用すればよい。 
- 
-==== 変換 ==== 
- 
-    awk -v taxID=$(cat) '{if($1==taxID){print $0}}'  names.dmp.sname.path |cut -f 2 
- 
-※AccessionID⇒TaxonomyIDの変換スクリプトとパイプでつないでいるものとする。 
- 
-names.dmp.sname.pathは以下のようなファイル 
- 
-{{:pasted:20211123-153017.png}} 
- 
-1行目が該当TaxonomyIDと一致する行を取得し、2行目のTaxonomy PATHを取得する。 
- 
- 
- 
- 
- 
  
  • accessionidからtaxonomypathへの変換.1637649053.txt.gz
  • 最終更新: 2021/11/23 06:30
  • by 133.11.144.12