差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン | |||
aiを使ったデータ解析入門2025 [2025/09/18 16:45] – suikou | aiを使ったデータ解析入門2025 [2025/09/18 18:10] (現在) – suikou | ||
---|---|---|---|
行 37: | 行 37: | ||
そこで、現実的にはどうやって確認するかですが、おそらくAIに楽に任せられるほうから紹介すると、 | そこで、現実的にはどうやって確認するかですが、おそらくAIに楽に任せられるほうから紹介すると、 | ||
- | - 1.正解がわかっているデータを既知の解析フローで処理させて、正解と同じ結果が得られるかどうかを見る。正解と違う場合は正解を教えて解析フローのバグを直すように伝えると、ほとんどの場合完全自動で解析フローを再現してくれます。(論文のデータを使って解析フローを作ってから、自分のデータを処理する場合など。なるべく具体的な解析フローや生の結果が出ている論文を選ぶのが良い) | + | - 1.正解がわかっているデータを既知の解析フローで処理させて、正解と同じ結果が得られるかどうかを見る。正解と違う場合は正解を教えて解析フローのバグを直すように伝えると、ほとんどの場合完全自動で解析フローを再現してくれます。(論文のデータを使って解析フローを作ってから、自分のデータを処理する場合など。なるべく具体的な解析フローや生の結果が出ている論文を選ぶのが良い。つまり、パイプラインを作ったというような論文をChatGPTで検索して、そのパイプラインを実行できるようにセットアップしてと頼む感じ。) |
- 2.そもそも解析フローを新規に作る必要があって本番データの正解がわからない場合は、まずは小さなデータで良いので、想定される全パターンを網羅した正しいテスト結果を手作業などで作成しておいてから、codexにそのデータを使って解析するように指示する。(プログラミングにおける、いわゆるテスターのお仕事ですね。お仕事としては嫌がる人が多かったのですが、今後はテスターが一番大事なのかなと思う今日この頃。) | - 2.そもそも解析フローを新規に作る必要があって本番データの正解がわからない場合は、まずは小さなデータで良いので、想定される全パターンを網羅した正しいテスト結果を手作業などで作成しておいてから、codexにそのデータを使って解析するように指示する。(プログラミングにおける、いわゆるテスターのお仕事ですね。お仕事としては嫌がる人が多かったのですが、今後はテスターが一番大事なのかなと思う今日この頃。) | ||
行 55: | 行 55: | ||
### 1. メタゲノム解析(アンプリコン)の場合 | ### 1. メタゲノム解析(アンプリコン)の場合 | ||
+ | このフォルダにあるfqファイルはバクテリアの16S rRNAアンプリコンシーケンスデータです。ナノポアでシーケンスしています。これらをSILVAのメタゲノムデータベースを使って解析してください。 | ||
+ | 30分くらいで | ||
- | ### 2. メタゲノム解析(ショットガン)の場合 | + | {{: |
+ | 今回の解析を再現するためにスクリプトを実行する手順を教えてください | ||
+ | |||
+ | |||
+ | ### 2. メタゲノム解析(ショットガン)の場合 | ||
+ | https:// | ||
### 3. RNA-seqの場合 | ### 3. RNA-seqの場合 |