魚類以外でのinputファイル作成について

魚類以外でのInputファイル作成について

以下の手順で行う。

Githubあるいは研究室サーバからInputファイル作成用のスクリプトを入手する。

①Githubから入手する場合は

git clone https://github.com/cDaIryPOUV/mitosearch_create_db_file.git

でたぶん行ける。(Tokenないとダメかもしれない。その場合はGithubから直接ダウンロードする)

②研究室サーバから入手する場合 /suikou/files/m768b/ito.takumi/work/mitosearchcreateinput/mitosearchcreatedb_file以下にあるスクリプトをコピーする。(m768bは他のサーバから見えないことがあるので注意。m768bにログイン後にm768bから自分が使いたいサーバにコピーするとよい。)

入手したシーケンスデータを1つのディレクトリの格納する。(/home/ito.takumi/work/mitosearch/nonfish/fastqにテスト用のシーケンスデータを格納しているのでテストの際はこれをコピーして使用。)

createinputnonfish.shを編集する。編集箇所は6行目の#—–から25行目の#—–までで、以下のディレクトリやファイルのPathを自分が使いたいPathに書き換える。

# ------------

# Scriptが配置されているディレクトリ
scriptdir=/suikou/files/m768b/ito.takumi/work/mitosearch_create_input/mitosearch_create_db_file
# 各サンプルの一時ファイルを配置するディレクトリを格納するディレクトリ
tmpdir=/home/ito.takumi/work/mitosearch/nonfish/tmp
# サンプルデータを配置するディレクトリ(各ディレクトリでファイルの重複がないようにする必要がある)
edna_file_list=(/home/ito.takumi/work/mitosearch/nonfish/fastq)
# MitoFishのBlast DBファイル
blastdb=/suikou/db/ncbi/2021-12-01_SSU_LSU_ITS_mito_plastid/SSU_LSU_ITS_mito_plastid.maskadapters.desc.fa
# inputファイルの出力先ディレクトリ
outputFileDirPath=/home/ito.takumi/work/mitosearch/nonfish/db_mollusk
# AccessionIDからTaxonomy Pathへの変換に用いるファイル
accession2taxid=/suikou/files/m768b/ito.takumi/work/20210810_nucl_gb.accession2taxid/nucl_gb.accession2taxid
# Taxonomy ID->Taxonomy PATHの変換に用いるファイル
taxid2taxpath=/suikou/db/ncbi/2021-06-01_taxdump/names.dmp.sname.path
# blasnのPath
blastPath=/suikou/files/m768b/ito.takumi/work/tool/blast/ncbi-blast-2.9.0+/bin/blastn

# ------------

以下を実行

bash create_input_nonfish.sh SRA番号

魚類の場合は

bash create_input_nonfish.sh SRA番号

魚類で手動で行いたい場合も同様にして、create_input.shの編集と実行を行えばよい

classifyファイルの作成

more /usr/local/blastdb/PR2_16S_23S_mito_plastid.maskadapters.havepath.fa.name|grep "root;cellular organisms;Eukaryota;Opisthokonta;Metazoa"|grep -v "root;cellular organisms;Eukaryota;Opisthokonta;Metazoa;Eumetazoa;Bilateria;Deuterostomia;Chordata;Craniata;Vertebrata" |cut -f 4|sort|uniq > yoshitake/invertebrate.list
  • 魚類以外でのinputファイル作成について.1660707267.txt.gz
  • 最終更新: 2022/08/17 03:34
  • by 133.11.50.163