差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン | |||
20210729 [2021/07/29 06:58] – 133.11.144.10 | 20210729 [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | ====== 20210729 ====== | ||
- | ===== ntデータベースにBLAST検索した時に魚類以外にヒットする問題に関して ===== | ||
- | |||
- | * ntデータベースにBLAST検索をかけて作成したInputファイルの上位にオオカミ(Canis lupus), | ||
- | * 可能性として、アダプタープライマーがシーケンスで読まれており、同じアダプターを使用したサンプルはntデータベース上でヒットしている可能性がある。 | ||
- | |||
- | ==== アダプタープライマー配列へのBLAST検索 ==== | ||
- | |||
- | MiFishの論文([[https:// | ||
- | |||
- | BLASTデータベース作成 | ||
- | makeblastdb -in adapters.fa -dbtype nucl | ||
- | |||
- | 魚類以外にヒットしたリードからヒットした配列のみを抽出する方法 | ||
- | |||
- | 1.魚類以外にヒットしたリードからヒットしたリード名とヒットした場所を調べる。 | ||
- | |||
- | cat / | ||
- | |||
- | 上記コマンドから1列目(Ex.DRR159194.100)と9列目、10列目(Ex.23 50)を調べる。 | ||
- | |||
- | 2.samtoolsを使って、ヒット箇所の配列を取得。 | ||
- | |||
- | samtools faidx / | ||
- | |||
- | 3.BLAST検索 | ||
- | |||
- | blastn -query input/ | ||
- | |||
- | Canis lupusで3read、Martesで2readに対して検索を行ったが、アダプター配列と相同性は見られなかった。 | ||
- | |||
- | ==== マージ後のリード数とヒットする生物の関係 ==== | ||
- | |||
- | ntデータベースへのBlast検索から作成したInputファイルについて、Inputファイルの上位に出現する生物種とその生物種へのヒットの仕方をBLASTの結果ファイルから確認した。 | ||
- | |||
- | やり方は以下の通り。 | ||
- | |||
- | 1.Inputファイルの上位4種を抽出 | ||
- | cat DRR159194.nt.input |head -n 5 | ||
- | |||
- | 2.ブラウザで生物種を確認。 | ||
- | |||
- | 3.ntデータベースへのBlast検索の結果を確認。 | ||
- | cat / | ||
- | |||
- | これにより以下のことが分かった。 | ||
- | |||
- | * 魚類にヒットしているリードについてはマージ後のリードの塩基数は200塩基程度のものがほとんどであった。(確認した範囲でそれ以外の長さのリードは見られなかった。) | ||
- | * 魚類以外にヒットしたリードについてはマージ後のリードの塩基数は50塩基程度のものが多かったが、一部200塩基程度のものも見られた。 | ||
- | |||
- | そのためマージしたリードのうち、50塩基程度の短いリードについては全て除去しても問題ないと考えられる。しかし200塩基程度のリードの中にも魚類以外にヒットするリードが一部存在するため、これを除去する必要がある。 |