name: research-plan description: 科研分析策略规划助手。根据用户的科研分析需求,通过调研顶尖期刊/会议论文的分析方法,制定个性化、可落地的最优分析策略。适用于需要制定实验设计、数据分析流程、技术路线的场景;兼容旧名 make-research-plan 的 prompt 触发。 metadata: author: Bensz Conan short-description: 基于文献调研制定科研分析策略 keywords: - research-plan - make-research-plan - 科研规划 - 文献调研 - 分析策略 - 实验设计 - 技术路线 - 方法学学习 - 分析计划 - 研究方案
Research Plan
与 bensz-collect-bugs 的协作约定
- 因本 skill 设计缺陷导致的 bug,先用
bensz-collect-bugs规范记录到~/.bensz-skills/bugs/,不要直接修改用户本地已安装的 skill 源码;若有 workaround,先记 bug,再继续完成任务。 - 只有用户明确要求“report bensz skills bugs”等公开上报时,才用本地
gh上传新增 bug 到huangwb8/bensz-bugs;不要 pull / clone 整个仓库。
基于文献调研的科研分析策略规划助手
旧名 make-research-plan 仅作为 prompt 兼容别名保留;.make-research-plan/ 是稳定历史工作区名,不随 skill 目录重命名。
核心功能
本 Skill 通过系统化调研顶尖期刊/会议论文,为用户制定个性化、可落地的科研分析策略。
核心价值
- 证据驱动:基于顶级期刊论文的方法学,而非凭空设计
- 系统性调研:自动化的文献检索、筛选、下载流程
- 深度学习:从 PDF 中提取分析方法和技术细节
- 可落地性:输出清晰的目标/步骤,可直接执行
使用场景
- 制定实验设计方案
- 规划数据分析流程
- 设计技术路线图
- 确定统计方法选择
- 制定可视化策略
工作流程
阶段 0:初始化
输入:
- 用户需求描述
- 工作目录路径(可选,默认当前目录)
操作:
- 验证工作目录存在且可写
- 创建隐藏工作目录
.make-research-plan/ - 明确告知用户创建的目录位置和用途
输出:
.make-research-plan/目录结构
目录结构:
.make-research-plan/
├── papers/ # 下载的 PDF 文献
├── metadata/ # 调研元数据
│ ├── theme.json # 主题和关键词
│ └── search_history.json # 检索历史
├── extracted/ # 提取的文献信息
│ └── papers_info.json # 论文结构化信息
├── analysis-framework.md # 分析框架总结
└── plan.md # 最终分析策略计划
阶段 1:主题提取与文献调研
步骤 1.1:主题提取
目标: 从用户需求中结构化提取研究主题和关键词
方法:
- 分析用户需求文本
- 识别核心研究领域
- 提取关键概念术语
- 生成多个相关主题(如适用)
- 为每个主题生成 3-5 个关键词
输出: metadata/theme.json
{
"primary_topic": {
"name": "主题名称",
"description": "主题描述",
"keywords": ["关键词1", "关键词2", "关键词3"]
},
"secondary_topics": [
{
"name": "相关主题1",
"keywords": ["关键词1", "关键词2"]
}
],
"extracted_at": "2026-01-19T09:30:00Z"
}
步骤 1.2:文献检索
检索策略:
多源检索:
- PubMed(生物医学)
- Google Scholar(综合)
- IEEE Xplore(工程技术)
- arXiv(预印本)
- Semantic Scholar(AI 驱动)
检索式构建:
- 主主题关键词 AND 分析方法相关词
- 优先检索近 5 年文献
- 限定高影响因子期刊/顶级会议
质量过滤:
- 优先 peer-reviewed 文章
- 排除非英文文献(除非用户指定)
- 优先高引用论文
输出: metadata/search_history.json
{
"searches": [
{
"topic": "主题名称",
"query": "检索式",
"source": "数据源",
"results_count": 150,
"timestamp": "2026-01-19T09:35:00Z"
}
]
}
步骤 1.3:文献筛选与评分
AI 逐篇评估:
语义相关性评分(1-10 分)
- 标题匹配度
- 摘要相关性
- 关键词重叠
子主题分组:
- 方法学论文
- 应用案例
- 综述文章
- 工具/软件
高分优先选取:
- 保留评分 ≥ 7 分的论文
- 确保各子主题都有代表性
- 控制总数在 15-30 篇
输出: metadata/papers_scored.json
{
"papers": [
{
"title": "论文标题",
"authors": ["作者1", "作者2"],
"year": 2024,
"journal": "期刊名",
"relevance_score": 9,
"subtopic": "方法学",
"doi": "10.xxxx/xxxxx",
"url": "https://doi.org/..."
}
]
}
步骤 1.4:生成参考文献清单
输出: references.bib
格式:标准 BibTeX,包含所有必要字段
步骤 1.5:下载 PDF
方法:
- 优先通过开放获取链接下载
- 使用 Unpaywall API 查找合法免费版本
- 保存到
papers/目录,命名格式:{第一作者姓氏}_{年份}_{期刊简写}.pdf
输出: papers/*.pdf
错误处理:
- 记录下载失败的 DOI
- 不阻塞后续流程
- 在最终报告中说明哪些论文未能获取
阶段 2:深度学习分析策略
步骤 2.1:PDF 信息提取
目标: 从每篇 PDF 中提取分析方法和技术细节
提取内容:
- 研究设计:实验类型、对照设置、样本量
- 数据预处理:清洗步骤、归一化方法、质量控制
- 统计方法:检验方法、多重比较校正、效应量
- 可视化策略:图表类型、配色方案、工具
- 软件工具:R/Python 包、版本、参数设置
- 验证方法:交叉验证、bootstrap、灵敏度分析
方法:
- 使用 PDF 读取工具提取文本和表格
- AI 语义分析识别 Methods 章节内容
- 结构化存储提取的信息
输出: extracted/papers_info.json
{
"papers": [
{
"id": "paper_001",
"title": "论文标题",
"methods": {
"study_design": "队列研究",
"preprocessing": ["质量控制", "归一化"],
"statistical_tests": ["t检验", "ANOVA"],
"correction": "FDR",
"visualization": ["箱线图", "热图"],
"software": {
"R": ["limma", "ggplot2"],
"parameters": {"adjust.method": "BH"}
}
},
"strengths": ["大样本量", "预注册"],
"limitations": ["单中心研究"]
}
]
}
步骤 2.2:综合分析框架
目标: 综合所有论文,提炼最佳实践
分析维度:
方法学共识:
- 多篇论文共用的方法
- 领域内标准流程
- 推荐的最佳实践
方法学差异:
- 不同场景的适用方法
- 新兴方法 vs 传统方法
- 争议点
工具生态:
- 最常用的软件包
- 工具的优缺点比较
- 版本兼容性
质量控制:
- 数据验证标准
- 结果稳健性检验
- 可复现性实践
输出: analysis-framework.md
模板见:research-plan/references/output-templates.md
阶段 3:制定个性化计划
步骤 3.1:需求对齐
分析用户需求:
- 研究问题是什么?
- 有什么特殊约束?
- 期望的输出是什么?
- 技能水平如何?
映射到分析框架:
- 匹配相关方法学章节
- 识别适用的工具
- 确定质量控制点
步骤 3.2:计划生成
输出: plan.md
模板见:research-plan/references/output-templates.md
步骤 3.3:计划审查
向用户呈现:
- 计划概要
- 关键决策点说明
- 可选方案对比
- 修改建议邀请
审查问题:
- 计划是否覆盖了你的需求?
- 步骤是否清晰可行?
- 有没有遗漏的分析?
- 有没有需要调整的部分?
输入规范
必需输入
- 需求描述:清晰描述要解决的问题和目标
可选输入
- 工作目录:默认当前目录
- 文献年份范围:默认近 5 年
- 目标期刊/会议:指定特定来源
- 语言偏好:默认英文
- 最大文献数:默认 30 篇
输出规范
核心输出
plan.md:最终分析策略计划(用户友好格式)analysis-framework.md:分析框架总结(详细技术文档)references.bib:参考文献清单(可引用)
辅助输出
metadata/:调研元数据(可复现)extracted/papers_info.json:论文信息结构化数据(可再利用)
限制与注意事项
功能边界
✅ 可以做的:
- 调研文献并总结方法学
- 制定分析策略和步骤
- 推荐工具和最佳实践
- 生成可执行的计划文档
❌ 严禁做的:
- 执行实际的数据分析
- 修改用户原始数据
- 撰写正式科研论文
- 做出科学结论
使用限制
- 仅提供策略建议,具体实施需要用户验证
- 方法学推荐基于文献,不能保证适用于所有场景
- PDF 依赖可获取性,部分文献可能无法获取
- AI 提取可能有误差,关键信息建议人工复核
质量保证
- 所有推荐都来自同行评议论文
- 明确标注证据强度(多论文共识 vs 单篇论文)
- 提供参考文献追溯
- 标注不确定性或争议点
最佳实践
对于用户
- 需求描述要具体:避免模糊表述
- 明确约束条件:数据类型、样本量、技能水平等
- 审查计划时认真:这是你的研究,你有最终决定权
- 保留工作目录:便于后续调整和复现
对于 AI 执行
- 透明性:明确告知每一步在做什么
- 可追溯性:所有推荐都有文献依据
- 保守性:不确定时承认而非编造
- 用户中心:计划要符合用户实际约束
故障排除
常见问题
Q: 无法下载某些 PDF A: 记录失败的 DOI,可以在最终报告中说明,或尝试手动获取
Q: 提取的方法信息不完整 A: 使用补充材料(supplementary materials)或联系作者
Q: 文献数量太少 A: 放宽检索条件(年份、关键词范围)
Q: 不同论文方法冲突 A: 在分析框架中标注争议点,提供多方案选择
实现说明(维护者)
实现/脚本状态与职责边界见:research-plan/references/implementation-notes.md
变更记录见:research-plan/CHANGELOG.md(版本号以 research-plan/config.yaml:skill_info.version 为准)