scientific-deep-research

star 3

科学文献の深層リサーチスキル。SHIKIGAMI の WebResearcher パラダイム (Think→Report→Action 反復サイクル)を科学研究に特化させた実装。 学術データベース検索、エビデンス階層評価、ソース追跡、交差検証、 ハルシネーション防止を統合した反復的深層調査を提供。 「文献調査して」「先行研究を調べて」「systematic review して」で発火。

nahisaho By nahisaho schedule Updated 2/12/2026

name: scientific-deep-research description: | 科学文献の深層リサーチスキル。SHIKIGAMI の WebResearcher パラダイム (Think→Report→Action 反復サイクル)を科学研究に特化させた実装。 学術データベース検索、エビデンス階層評価、ソース追跡、交差検証、 ハルシネーション防止を統合した反復的深層調査を提供。 「文献調査して」「先行研究を調べて」「systematic review して」で発火。

Scientific Deep Research

科学文献の反復的深層リサーチを支援するスキル。SHIKIGAMI の WebResearcher パラダイム(Think→Report→Action サイクル)を科学研究コンテキストに適応し、 学術データベース検索・エビデンス階層評価・ソース追跡・交差検証を統合する。

When to Use

  • 科学研究テーマの先行研究調査を行うとき
  • Systematic Review / Scoping Review の文献検索を行うとき
  • 特定の研究トピックの最新動向を網羅的に調査するとき
  • 技術比較・手法比較のための情報収集が必要なとき
  • Grant proposal / Research proposal の背景調査をするとき
  • 論文 Introduction のための文献レビューを行うとき

Quick Start

1. Deep Research ワークフロー概要

Phase 1: Research Question Definition(研究課題の定義)
    ↓
Phase 2: Deep Research(反復的深層リサーチ)
    ┌──────────────────────────────────────────┐
    │  Think → Search → Evaluate → Synthesize  │ ← 反復サイクル
    │         (最大 15 ラウンド)                │
    └──────────────────────────────────────────┘
    ↓
Phase 3: Evidence Synthesis(エビデンス統合)
    ↓
Phase 4: Research Report(リサーチレポート生成)

2. WebResearcher パラダイム(科学研究適応版)

SHIKIGAMIの Think→Report→Action サイクルを科学研究に最適化:

┌─────────────────────────────────────────────────────┐
│  Round N                                            │
│  ┌─────────────────────────────────────────────┐   │
│  │ Workspace (前ラウンドの Synthesis + 新文献)   │   │
│  └─────────────────────────────────────────────┘   │
│           ↓                                         │
│  ┌───────────┐  ┌───────────┐  ┌───────────────┐  │
│  │  Think    │→│  Search   │→│  Evaluate      │  │
│  │ (知識     │  │ (学術DB   │  │ (エビデンス   │  │
│  │  ギャップ │  │  検索)    │  │  評価)        │  │
│  │  分析)    │  │           │  │               │  │
│  └───────────┘  └───────────┘  └───────┬───────┘  │
│                                         ↓          │
│                                ┌───────────────┐   │
│                                │  Synthesize   │   │
│                                │ (進化する     │   │
│                                │  レビュー)    │   │
│                                └───────────────┘   │
└─────────────────────────────────────────────────────┘

Phase 1: Research Question Definition

PICO/PECO 構造化

リサーチクエスチョンを構造化し、検索戦略の基盤を構築する。

## Research Question の構造化

### PICO (介入研究)
- **P** (Population): 対象集団・研究対象
- **I** (Intervention): 介入・手法・技術
- **C** (Comparison): 比較対象・既存手法
- **O** (Outcome): 評価指標・アウトカム

### PECO (観察研究)
- **P** (Population): 対象集団
- **E** (Exposure): 曝露・要因
- **C** (Comparison): 比較群
- **O** (Outcome): アウトカム

### SPIDER (質的研究)
- **S** (Sample): サンプル
- **PI** (Phenomenon of Interest): 関心現象
- **D** (Design): 研究デザイン
- **E** (Evaluation): 評価方法
- **R** (Research type): 研究種別

検索戦略の設計

## 検索戦略テンプレート

### 1. キーワード設計
| 概念 | 日本語キーワード | 英語キーワード | MeSH / 統制語彙 |
|------|-----------------|---------------|-----------------|
| P    | [対象]          | [population]  | [MeSH term]     |
| I/E  | [介入/曝露]     | [intervention]| [MeSH term]     |
| C    | [比較]          | [comparison]  | [MeSH term]     |
| O    | [アウトカム]    | [outcome]     | [MeSH term]     |

### 2. ブール演算子の組み合わせ
(P terms) AND (I terms) AND (O terms)

### 3. 包含・除外基準
| 基準 | 包含 | 除外 |
|------|------|------|
| 出版年 | [YYYY]-present | < [YYYY] |
| 言語 | English, Japanese | Others |
| 研究デザイン | [RCT, Cohort, etc.] | [Case report, etc.] |
| 出版種別 | Original article, Review | Editorial, Letter |

Phase 2: Deep Research(反復的深層リサーチ)

Think フェーズ(知識ギャップ分析)

各ラウンドの冒頭で現在の知識状態を評価し、次のアクションを決定する。

## Think フェーズのチェックリスト

### 知識状態の評価
- [ ] 現在収集済みの文献数とカバレッジ
- [ ] 未解決の研究課題・サブクエスチョン
- [ ] エビデンスが不足している領域
- [ ] 矛盾する知見の有無

### 次アクションの決定
- SEARCH: 知識ギャップが大きい → 追加検索
- VISIT: 有望な論文を発見 → 詳細取得
- VERIFY: 重要な知見 → 別ソースで交差検証
- COMPLETE: 十分な情報収集 → 統合フェーズへ

重要: Think フェーズの内部推論は次ラウンドに引き継がない (コンテキスト汚染防止、SHIKIGAMI 準拠)。

Search フェーズ(学術データベース検索)

検索対象データベース

データベース 対象分野 検索方法 優先度
PubMed / MEDLINE 生命科学・医学 MeSH + Free text P0 (生命科学)
Google Scholar 全分野 Free text P0 (全般)
arXiv 物理・CS・数学・生物 Free text P0 (物理・CS)
Semantic Scholar 全分野 (AI 解析付き) API / Free text P1
Web of Science 全分野 (IF 付き) Topic search P1
Scopus 全分野 Title-Abs-Key P1
CrossRef DOI メタデータ DOI lookup P2
CiNii 日本語文献 Free text P1 (日本語)
J-STAGE 日本語学術誌 Free text P1 (日本語)
ChemRxiv 化学 Free text P2 (化学)
bioRxiv / medRxiv プレプリント Free text P2 (生命科学)

検索ルール(必須)

## 検索の実行規則

### 日英並列検索(必須)
- 全てのクエリは日本語・英語の両方で実行する
- 例: ["ZnO薄膜 スパッタリング 特性", "ZnO thin film sputtering properties"]

### 学術ドメイン優先
- 以下のドメインを優先的に評価:
  .ac.jp, .edu, .gov, .go.jp, .org (学術機関)
  pubmed.ncbi.nlm.nih.gov
  scholar.google.com
  arxiv.org
  doi.org

### 検索式の構造化
- ブール演算子 (AND, OR, NOT) を活用
- ワイルドカード (*) で語幹展開
- フレーズ検索 ("exact phrase") で精度向上
- フィルタ: 出版年、研究デザイン、言語

### 失敗時のフォールバック
- 404/5xx エラー → Wayback Machine → Archive.today
- 検索結果 0 件 → クエリ簡略化 → 同義語展開 → 上位概念へ

Evaluate フェーズ(エビデンス評価)

収集した各文献・情報源のエビデンスレベルと信頼性を評価する。

エビデンス階層(Evidence Hierarchy)

## エビデンスレベル分類

| Level | 研究デザイン | 信頼度 | 記号 |
|-------|-------------|--------|------|
| 1a | Systematic Review of RCTs | ★★★★★ | [SR] |
| 1b | Individual RCT | ★★★★☆ | [RCT] |
| 2a | Systematic Review of Cohort | ★★★★☆ | [SR-C] |
| 2b | Individual Cohort Study | ★★★☆☆ | [Cohort] |
| 3a | Systematic Review of Case-Control | ★★★☆☆ | [SR-CC] |
| 3b | Individual Case-Control Study | ★★☆☆☆ | [CC] |
| 4 | Case Series / Cross-sectional | ★★☆☆☆ | [CS] |
| 5 | Expert Opinion / Narrative Review | ★☆☆☆☆ | [EO] |
| — | Preprint (not peer-reviewed) | ☆☆☆☆☆ | [PP] |

ソース信頼性スコアリング

## 信頼性評価マトリクス

| 評価項目 | スコア範囲 | 重み |
|---------|-----------|------|
| **ジャーナル IF / ランク** | 0-25 | ×2 |
| **著者の h-index / 実績** | 0-25 | ×1.5 |
| **サンプルサイズ n** | 0-25 | ×1.5 |
| **統計手法の適切性** | 0-25 | ×1 |
| **再現性・データ公開** | 0-25 | ×1 |
| **出版年の新しさ** | 0-25 | ×0.5 |

### 総合信頼度スコア
- 80-100: ★★★★★ 高信頼
- 60-79:  ★★★★☆ 信頼
- 40-59:  ★★★☆☆ 中程度
- 20-39:  ★★☆☆☆ 低信頼
- 0-19:   ★☆☆☆☆ 要注意

### 信頼度不足時のアクション
- スコア 60 未満 → 交差検証必須(別ソースで確認)
- プレプリント → 「⚠️ 未査読」マーキング必須
- 5 年以上前 → 「⚠️ 要更新確認」マーキング推奨

批判的評価チェックリスト

## 文献の批判的評価 (Critical Appraisal)

### RCT 評価 (Cochrane Risk of Bias 準拠)
- [ ] ランダム化の方法は適切か
- [ ] 割り付けの隠蔽化はされているか
- [ ] ブラインドは適切か(参加者・評価者)
- [ ] 欠測データの処理は適切か
- [ ] アウトカムの選択的報告はないか
- [ ] その他のバイアスリスクはないか

### 観察研究評価 (Newcastle-Ottawa Scale 準拠)
- [ ] 対象群の選択は適切か
- [ ] 群間の比較可能性はあるか
- [ ] アウトカムの測定は適切か
- [ ] フォローアップは十分か

### 系統的レビュー評価 (AMSTAR-2 準拠)
- [ ] プロトコルは事前登録されているか
- [ ] 包括的な文献検索が行われているか
- [ ] バイアスリスク評価が行われているか
- [ ] メタアナリシスの手法は適切か

Synthesize フェーズ(進化するレビュー)

各ラウンドで収集した情報を統合し、進化するリサーチレポートを更新する。

## Evolving Research Report(進化するリサーチレポート)

### Round N の更新内容
| 要素 | 内容 |
|------|------|
| **Rationale(根拠)** | 研究課題に直接関連する具体的知見の特定 |
| **Evidence(証拠)** | 最も関連性の高い情報の抽出(原文保持優先) |
| **Summary(要約)** | 現時点での知見の統合・整理 |
| **Confidence(確信度)** | 0-100% — 十分な情報が集まったかの指標 |
| **Gaps(ギャップ)** | 残存する知識ギャップの一覧 |

### 完了判定基準
- [ ] 主要な研究課題が回答されている
- [ ] 最低 5 件の査読済み文献を収集
- [ ] 日英両方で検索が実行されている
- [ ] 全てのデータに出典 URL/DOI が付与されている
- [ ] 信頼度スコア 60% 以上のソースが 3 件以上
- [ ] 矛盾する知見がある場合、交差検証が完了している

Phase 3: Evidence Synthesis(エビデンス統合)

PRISMA フロー(Systematic Review 用)

## PRISMA 2020 フローテンプレート

### Identification(同定)
- データベース検索: n = ___
  - PubMed: n = ___
  - Google Scholar: n = ___
  - arXiv: n = ___
  - その他: n = ___
- その他の情報源: n = ___
  - 引用文献追跡: n = ___
  - 被引用文献追跡: n = ___
  - 手動検索: n = ___

### Screening(スクリーニング)
- 重複除去後: n = ___
- タイトル/抄録スクリーニング: n = ___
  - 除外: n = ___ (理由: ___)
- 全文スクリーニング: n = ___
  - 除外: n = ___ (理由: ___)

### Included(採択)
- 質的統合に含めた研究: n = ___
- 量的統合(メタアナリシス)に含めた研究: n = ___

統合分析テンプレート

## エビデンス統合テーブル

| # | 著者 (年) | 研究デザイン | n | 主要結果 | 信頼度 | DOI |
|---|----------|-------------|---|---------|--------|-----|
| 1 | Author (2024) | [RCT] | 100 | [key finding] | ★★★★☆ | 10.xxxx |
| 2 | Author (2023) | [Cohort] | 500 | [key finding] | ★★★☆☆ | 10.xxxx |
| ... | | | | | | |

## 知見の統合
### 一致する知見
- [複数の研究で支持されている知見を記述]

### 矛盾する知見
- [文献 A] は [知見 X] を報告しているが、[文献 B] は [知見 Y] を報告
  - 考えられる理由: [方法論の差異 / 対象集団の違い / ...]

### エビデンスギャップ
- [十分な研究がない領域を特定]

Phase 4: Research Report(リサーチレポート生成)

レポートテンプレート

# Deep Research Report: [研究テーマ]

**生成日**: YYYY-MM-DD
**リサーチラウンド数**: N 回
**収集文献数**: M 件
**主要データベース**: [PubMed, Google Scholar, ...]

---

## Executive Summary

[3-5 文で主要な知見を要約]

## 1. Research Question

### 1.1 構造化された研究課題
[PICO/PECO 形式で記述]

### 1.2 検索戦略
[実行した検索式・フィルタの記録]

## 2. Findings

### 2.1 [サブトピック 1]
[知見の記述 + 引用]

### 2.2 [サブトピック 2]
[知見の記述 + 引用]

### 2.3 [サブトピック 3]
[知見の記述 + 引用]

## 3. Evidence Summary

### 3.1 エビデンステーブル
[統合分析テーブル]

### 3.2 エビデンスの強さ
[GRADE アプローチによる評価]

## 4. Knowledge Gaps & Future Directions

[特定されたギャップと今後の研究方向]

## 5. References

[全引用文献リスト — DOI/URL 必須]

ソース追跡・ハルシネーション防止

ソース追跡ルール(必須)

## 全データにソース情報を付与する

### 必須項目
| 項目 | 説明 | 例 |
|------|------|---|
| **著者** | 筆頭著者 et al. | Smith et al. |
| **年** | 出版年 | 2024 |
| **ジャーナル** | 掲載誌名 | Nature |
| **DOI** | Digital Object Identifier | 10.1038/s41586-... |
| **URL** | アクセス用 URL | https://doi.org/10.1038/... |
| **アクセス日** | 情報取得日 | 2026-02-12 |
| **エビデンスレベル** | 研究デザイン | [RCT] |
| **信頼度スコア** | 評価結果 | ★★★★☆ (78/100) |

ハルシネーション防止マーキング

## 情報の確度マーキング(必須)

| マーカー | 意味 | 使用条件 |
|---------|------|---------|
| ✅ | 検証済み(2+ ソースで確認) | 複数の独立したソースで確認 |
| 📎 | 単一ソース | 1 つのソースからの情報 |
| ⚠️ | 未査読・要確認 | プレプリント、灰色文献 |
| ❓ | AI による推定・補完 | ソースなし、推測を含む |
| 🔄 | 古いデータ(5 年以上) | 最新情報で要更新確認 |
| ⚡ (?) | 情報源間の矛盾 | 複数ソースで矛盾する情報 |

### 使用例
- ✅ ZnO 薄膜のバンドギャップは 3.37 eV である [Smith 2024, Tanaka 2023]
- 📎 新規触媒の変換効率は 95% と報告されている [Lee 2024]
- ⚠️ 量子コンピュータによる最適化で 10x 高速化(プレプリント)[arXiv:2024.xxxxx]
- ❓ この方法は他の金属酸化物にも適用可能と考えられる
- ⚡ (?) 市場規模は $50B [Report A] vs $35B [Report B]

交差検証(Cross-Validation)

## 交差検証の実行ルール

### 必須条件
- 重要な数値データ → 最低 2 ソースで確認
- 主要な主張 → 独立した研究で確認
- 矛盾発見時 → 第 3 のソースで検証

### 数値データの矛盾処理
| 乖離率 | 重大度 | アクション |
|--------|--------|----------|
| < 5% | 低 | 範囲として記述 (e.g., 3.35-3.37 eV) |
| 5-20% | 中 | ⚡ (?) マーク、測定条件の差異を注記 |
| > 20% | 高 | ⚡ (?) マーク、追加調査、条件差異の分析 |

### 内容・見解の矛盾処理
1. 両方の見解を併記する
2. 各見解のエビデンスレベルを明示する
3. 矛盾の考えられる要因を分析する
   - 研究デザインの違い
   - 対象集団の違い
   - 測定方法の違い
   - 出版バイアスの可能性

品質ゲート(Quality Gates)

## Deep Research 完了チェックリスト

### Phase 1→2 ゲート(研究課題定義→リサーチ開始)
- [ ] PICO/PECO が構造化されている
- [ ] 検索キーワードが日英両方で定義されている
- [ ] 包含・除外基準が明確である

### Phase 2→3 ゲート(リサーチ→統合)
- [ ] 最低 5 件の査読済み文献を収集
- [ ] 全てのデータに DOI/URL が付与されている
- [ ] 日英両方で検索が実行されている
- [ ] 信頼度スコア 60% 以上のソースが 3 件以上
- [ ] 主要な知見に対する交差検証が完了

### Phase 3→4 ゲート(統合→レポート)
- [ ] エビデンステーブルが完成している
- [ ] 矛盾する知見が整理されている
- [ ] 知識ギャップが特定されている

### Phase 4 完了ゲート(レポート完成)
- [ ] 全引用に DOI/URL が記載されている
- [ ] ハルシネーション防止マーカーが付与されている
- [ ] PRISMA フロー(該当する場合)が作成されている
- [ ] Executive Summary が本文と整合している

検索戦略テンプレート(分野別)

生命科学・医学

## PubMed 検索戦略

### MeSH + Free text の組み合わせ
("Drug Delivery Systems"[MeSH] OR "drug delivery"[tiab])
AND
("Nanoparticles"[MeSH] OR nanoparticle*[tiab])
AND
("Neoplasms"[MeSH] OR cancer[tiab] OR tumor[tiab])

### フィルタ
- Publication date: 2020/01/01 - present
- Article type: Clinical Trial, Randomized Controlled Trial, Review
- Language: English, Japanese

材料科学・化学

## Google Scholar / Scopus 検索戦略

### キーワード組み合わせ
("ZnO thin film" OR "zinc oxide film")
AND
(sputtering OR "physical vapor deposition" OR PVD)
AND
(optical OR electrical OR "band gap")

### 年代フィルタ: 2020-present
### 引用数ソート: 被引用数降順で上位 50 件を確認

コンピュータサイエンス・AI

## arXiv / Semantic Scholar 検索戦略

### キーワード
("large language model" OR LLM)
AND
("retrieval augmented generation" OR RAG)
AND
(evaluation OR benchmark)

### カテゴリフィルタ: cs.CL, cs.AI, cs.IR
### ソート: 最新順 + 被引用数

他スキルとの連携

パイプライン上の位置づけ

deep-research → hypothesis-pipeline → pipeline-scaffold → academic-writing
  (文献調査)    (仮説定義)          (解析実行)         (草稿作成)

連携スキル

スキル 連携内容
scientific-hypothesis-pipeline Deep Research の結果から仮説を定式化
scientific-academic-writing 収集した文献を Introduction / Discussion に反映
scientific-citation-checker 引用の網羅性・整合性を検証
scientific-critical-review リサーチレポートの批判的レビュー
scientific-meta-analysis 収集した文献データでメタアナリシスを実行
scientific-statistical-testing 数値データの統計的検証

Output Files

ファイル 形式 内容
research/research_report.md Markdown Deep Research レポート
research/evidence_table.json JSON エビデンス統合テーブル
research/search_log.md Markdown 検索実行ログ(検索式・結果数・日時)
research/source_registry.json JSON ソース追跡レジストリ
research/prisma_flow.md Markdown PRISMA フロー(該当時)

research_report.md のフォーマット

---
title: "[研究テーマ]"
date: "YYYY-MM-DD"
rounds: N
sources_count: M
databases: ["PubMed", "Google Scholar", ...]
confidence_score: XX%
---

# Deep Research Report: [研究テーマ]
...

evidence_table.json のスキーマ

{
  "research_question": "...",
  "search_strategy": {
    "databases": ["PubMed", "Google Scholar"],
    "date_range": "2020-2026",
    "keywords": {
      "ja": ["キーワード1", "キーワード2"],
      "en": ["keyword1", "keyword2"]
    }
  },
  "sources": [
    {
      "id": "S001",
      "authors": "Smith et al.",
      "year": 2024,
      "title": "...",
      "journal": "Nature",
      "doi": "10.1038/...",
      "url": "https://doi.org/...",
      "evidence_level": "1b",
      "study_design": "RCT",
      "sample_size": 100,
      "key_findings": ["..."],
      "credibility_score": 85,
      "accessed_date": "2026-02-12"
    }
  ],
  "synthesis": {
    "consistent_findings": ["..."],
    "conflicting_findings": ["..."],
    "evidence_gaps": ["..."]
  }
}

source_registry.json のスキーマ

{
  "registry_version": "1.0",
  "created_at": "2026-02-12T00:00:00+09:00",
  "sources": [
    {
      "id": "S001",
      "url": "https://doi.org/...",
      "doi": "10.1038/...",
      "accessed_at": "2026-02-12T10:30:00+09:00",
      "retrieval_method": "search",
      "query_used": "ZnO thin film sputtering",
      "database": "Google Scholar",
      "status": "active",
      "credibility_score": 85,
      "evidence_level": "2b",
      "cross_validated": true,
      "cross_validation_sources": ["S003", "S007"]
    }
  ]
}

References

利用可能ツール

ToolUniverse SMCP 経由で利用可能な外部ツール。

カテゴリ 主要ツール 用途
PubMed PubMed_search_articles 文献検索
PubMed PubMed_get_cited_by 被引用構造分析
EuropePMC EuropePMC_search_articles ヨーロッパ文献検索
Crossref Crossref_search_works 出版情報検索
OpenAlex OpenAlex_Guidelines_Search オープンアクセス文献
ArXiv ArXiv_search_papers プレプリント検索
Install via CLI
npx skills add https://github.com/nahisaho/satori --skill scientific-deep-research
Repository Details
star Stars 3
call_split Forks 1
navigation Branch main
article Path SKILL.md
More from Creator