peer-review - SKILL.md Agent Skill

name: peer-review description: 使用 checklist-based evaluation 进行结构化 manuscript/grant review。用于撰写正式 peer reviews，包含具体 criteria、methodology assessment、statistical validity、reporting standards compliance（CONSORT/STROBE）和 constructive feedback。最适合实际 review writing、manuscript revision。评估 claims/evidence quality 请用 scientific-critical-thinking；量化评分框架请用 scholar-evaluation。 allowed-tools: Read Write Edit Bash license: MIT license metadata: skill-author: K-Dense Inc.

科学批判性评估与同行评审

概览

Peer review 是评估 scientific manuscripts 的系统过程。评估 methodology、statistics、design、reproducibility、ethics 和 reporting standards。将此 skill 用于跨学科 manuscript 和 grant review，进行建设性且严谨的评估。

何时使用此 Skill

此 skill 应用于：

为 journals 进行 scientific manuscripts peer review
评估 grant proposals 和 research applications
评估 methodology 和 experimental design rigor
审阅 statistical analyses 和 reporting standards
评估 reproducibility 和 data availability
检查是否符合 reporting guidelines（CONSORT、STROBE、PRISMA）
对 scientific writing 提供 constructive feedback

使用 Scientific Schematics 增强视觉表达

使用此 skill 创建文档时，始终考虑添加 scientific diagrams 和 schematics 来增强视觉沟通。

如果你的文档尚未包含 schematics 或 diagrams：

使用 scientific-schematics skill 生成 AI-powered publication-quality diagrams
用自然语言简单描述你想要的 diagram
Nano Banana Pro 会自动生成、审阅并完善 schematic

对于新文档： 默认应生成 scientific schematics，以可视化呈现文本中描述的 key concepts、workflows、architectures 或 relationships。

如何生成 schematics：

python scripts/generate_schematic.py "your diagram description" -o figures/output.png

AI 会自动：

创建 formatting 正确的 publication-quality images
通过多轮迭代审阅和完善
确保 accessibility（colorblind-friendly、high contrast）
将输出保存到 figures/ directory

何时添加 schematics：

Peer review workflow diagrams
Evaluation criteria decision trees
Review process flowcharts
Methodology assessment frameworks
Quality assessment visualizations
Reporting guidelines compliance diagrams
任何适合用可视化帮助理解的复杂概念

关于创建 schematics 的详细指南，请参考 scientific-schematics skill documentation。

Peer Review Workflow

通过以下阶段系统开展 peer review，并根据 manuscript type 和 discipline 调整深度与重点。

阶段 1：初步评估

从高层次评估开始，判断 manuscript 的范围、novelty 和整体质量。

关键问题：

中心 research question 或 hypothesis 是什么？
主要 findings 和 conclusions 是什么？
这项工作在科学上是否可靠且重要？
这项工作是否适合目标 venue？
是否存在会直接阻碍发表的重大缺陷？

输出： 简短 summary（2-3 句），概括 manuscript 的实质内容和初步印象。

阶段 2：逐节详细审阅

对 manuscript 每个 section 进行彻底评估，记录具体 concerns 和 strengths。

Abstract 和 Title

Accuracy： abstract 是否准确反映 study 的内容和 conclusions？
Clarity： title 是否具体、准确且信息充分？
Completeness： key findings 和 methods 是否得到适当概括？
Accessibility： abstract 是否能被广泛 scientific audience 理解？

Introduction

Context： background information 是否充分且最新？
Rationale： research question 的动机和依据是否清楚？
Novelty： 工作的 originality 和 significance 是否阐述清楚？
Literature： 相关 prior studies 是否得到适当引用？
Objectives： research aims/hypotheses 是否明确陈述？

Methods

Reproducibility： 其他研究者是否能根据提供的描述复现 study？
Rigor： methods 是否适合回答 research questions？
Detail： protocols、reagents、equipment 和 parameters 是否描述充分？
Ethics： ethical approvals、consent 和 data handling 是否有适当记录？
Statistics： statistical methods 是否合适、描述清楚且有依据？
Validation： controls、replicates 和 validation approaches 是否充分？

需要验证的关键元素：

Sample sizes 和 power calculations
Randomization 和 blinding procedures
Inclusion/exclusion criteria
Data collection protocols
Computational methods 和 software versions
Statistical tests 以及 multiple comparisons correction

Results

Presentation： results 是否逻辑清楚地呈现？
Figures/Tables： visualizations 是否合适、清楚且正确标注？
Statistics： statistical results 是否正确报告（effect sizes、confidence intervals、p-values）？
Objectivity： results 呈现是否避免过度解读？
Completeness： 是否包含所有 relevant results，包括 negative results？
Reproducibility： 是否提供 raw data 或 summary statistics？

需要识别的常见问题：

选择性报告 results
不恰当的 statistical tests
缺少 error bars 或 variability measures
Over-fitting 或 circular analysis
Batch effects 或 confounding variables
缺少 controls 或 validation experiments

Discussion

Interpretation： conclusions 是否由 data 支持？
Limitations： study limitations 是否被承认并讨论？
Context： findings 是否被适当地置于 existing literature 中？
Speculation： speculation 是否与 data-supported conclusions 清楚区分？
Significance： implications 和 importance 是否阐述清楚？
Future directions： 是否讨论了 next steps 或 unanswered questions？

危险信号：

夸大 conclusions
忽视 contradictory evidence
基于 correlational data 提出 causal claims
limitations 讨论不足
在缺少 mechanistic evidence 时提出 mechanistic claims

References

Completeness： 是否引用 key relevant papers？
Currency： 是否纳入近期重要 studies？
Balance： 是否适当引用 contrary viewpoints？
Accuracy： citations 是否准确且合适？
Self-citation： 是否存在过度或不恰当的 self-citation？

阶段 3：Methodological 与 Statistical Rigor

评估 research 的技术质量和严谨性，特别关注 common pitfalls。

Statistical Assessment：

statistical assumptions 是否满足（normality、independence、homoscedasticity）？
是否在 p-values 之外同时报告 effect sizes？
multiple testing correction 是否适当应用？
是否提供 confidence intervals？
sample size 是否通过 power analysis 论证？
parametric vs. non-parametric tests 的选择是否合适？
missing data 是否妥善处理？
是否区分 exploratory vs. confirmatory analyses？

Experimental Design：

controls 是否合适且充分？
replication 是否充分（biological 和 technical）？
potential confounders 是否被识别并控制？
randomization 是否正确实施？
blinding procedures 是否充分？
experimental design 对 research question 是否最优？

Computational/Bioinformatics：

computational methods 是否描述清楚且有依据？
software versions 和 parameters 是否记录？
code 是否可用以支持 reproducibility？
algorithms 和 models 是否得到适当验证？
computational methods 的 assumptions 是否满足？
batch correction 是否适当应用？

阶段 4：Reproducibility 与 Transparency

评估 research 是否满足现代 reproducibility 和 open science 标准。

Data Availability：

raw data 是否存放在合适 repositories？
是否为 public databases 提供 accession numbers？
data sharing restrictions 是否有正当理由（例如 patient privacy）？
data formats 是否标准且可访问？

Code and Materials：

analysis code 是否可用（GitHub、Zenodo 等）？
unique materials 是否可获取，或是否被充分描述以便重建？
protocols 是否足够详细？

Reporting Standards：

manuscript 是否遵循 discipline-specific reporting guidelines（CONSORT、PRISMA、ARRIVE、MIAME、MINSEQE 等）？
常见 guidelines 见 references/reporting_standards.md
对应 checklist 的所有元素是否都已处理？

阶段 5：Figure 与 Data Presentation

评估 data visualization 的质量、清晰度和完整性。

Quality Checks：

figures 是否为 high resolution 且标注清楚？
axes 是否正确标注并包含 units？
error bars 是否定义（SD、SEM、CI）？
statistical significance indicators 是否解释？
color schemes 是否合适且 accessible（colorblind-friendly）？
images 是否包含 scale bars？
data visualization 是否适合 data type？

Integrity Checks：

是否存在 image manipulation 迹象（duplications、splicing）？
Western blots 和 gels 是否适当呈现？
representative images 是否真正具有代表性？
是否展示所有 conditions（无 selective presentation）？

Clarity：

figures 能否与 legends 一起独立理解？
每个 figure 的信息是否一目了然？
是否存在冗余 figures 或 panels？
data 是否更适合用 tables 或 figures 呈现？

阶段 6：Ethical Considerations

验证 research 是否符合 ethical standards 和 guidelines。

Human Subjects：

是否记录 IRB/ethics approval？
是否描述 informed consent？
vulnerable populations 是否得到适当保护？
patient privacy 是否得到充分保护？
potential conflicts of interest 是否披露？

Animal Research：

是否记录 IACUC 或等效 approval？
procedures 是否 humane 且有依据？
是否考虑 3Rs（replacement、reduction、refinement）？
euthanasia methods 是否合适？

Research Integrity：

是否存在 data fabrication 或 falsification 方面的担忧？
authorship 是否合适且有依据？
competing interests 是否披露？
funding source 是否披露？
是否存在 plagiarism 或 duplicate publication 方面的担忧？

阶段 7：Writing Quality 与 Clarity

评估 manuscript 的清晰度、组织结构和可理解性。

Structure and Organization：

manuscript 组织是否合乎逻辑？
sections 之间是否连贯？
ideas 之间的 transitions 是否清楚？
narrative 是否有说服力且清晰？

Writing Quality：

language 是否清楚、精确且简洁？
jargon 和 acronyms 是否最少化并被定义？
grammar 和 spelling 是否正确？
sentences 是否不必要地复杂？
passive voice 是否过度使用？

Accessibility：

non-specialist 是否能理解 main findings？
technical terms 是否解释？
significance 对广泛受众是否清楚？

组织 Peer Review Reports

以分层结构组织 feedback，按优先级排列问题并提供 actionable guidance。

Summary Statement

提供简洁的整体评估（1-2 段）：

research 的简短 synopsis
overall recommendation（accept、minor revisions、major revisions、reject）
key strengths（2-3 个 bullet points）
key weaknesses（2-3 个 bullet points）
对 significance 和 soundness 的底线评估

Major Comments

列出会显著影响 manuscript validity、interpretability 或 significance 的关键问题。按顺序编号，方便引用。

Major comments 通常包括：

fundamental methodological flaws
inappropriate statistical analyses
unsupported 或 overstated conclusions
缺少 critical controls 或 experiments
serious reproducibility concerns
literature coverage 中的重大缺口
ethical concerns

每条 major comment 应：

清楚陈述问题
解释为什么有问题
建议具体解决方案或 additional experiments
指明解决它是否是发表的必要条件

Minor Comments

列出较不关键、但会改善 clarity、completeness 或 presentation 的问题。按顺序编号。

Minor comments 通常包括：

不清楚的 figure labels 或 legends
缺少 methodological details
typographical 或 grammatical errors
改进 data presentation 的建议
minor statistical reporting issues
可加强 conclusions 的 supplementary analyses
请求澄清

每条 minor comment 应：

标明具体位置（section、paragraph、figure）
清楚说明问题
建议如何处理

具体逐行 Comments（可选）

对于需要详细反馈的 manuscripts，提供 section-specific 或 line-by-line comments：

引用具体 page/line numbers 或 sections
记录 factual errors、unclear statements 或 missing citations
建议具体 edits 以提升 clarity

给作者的问题

列出需要澄清的具体问题：

不清楚的 methodological details
表面上相互矛盾的 results
评估该工作所需但缺失的信息
对 additional data 或 analyses 的请求

语气与方法

在整个 review 中保持建设性、专业且 collegial 的语气。

Best Practices：

Be constructive： 将批评表述为改进机会
Be specific： 提供具体 examples 和 actionable suggestions
Be balanced： 同时承认 strengths 和 weaknesses
Be respectful： 记住作者投入了大量努力
Be objective： 聚焦 science，而不是 scientists
Be thorough： 不遗漏问题，但要适当排序优先级
Be clear： 避免含糊或笼统的批评

避免：

personal attacks 或 dismissive language
sarcasm 或 condescension
没有具体 examples 的笼统批评
要求超出 scope 的不必要 experiments
要求遵循个人偏好而非 best practices
如果是 double-blind review，不要暴露自己的身份

按 Manuscript Type 的特殊考量

Original Research Articles

强调 rigor、reproducibility 和 novelty
评估 significance 和 impact
验证 conclusions 是否 data-driven
检查 methods 是否完整且 controls 是否适当

Reviews and Meta-Analyses

评估 literature coverage 的全面性
评估 search strategy 和 inclusion/exclusion criteria
验证 systematic approach 和是否缺少 bias
检查是否有 critical analysis，而不只是 summary
对 meta-analyses，评估 statistical approach 和 heterogeneity

Methods Papers

强调 validation 以及与 existing methods 的比较
评估 reproducibility 以及 protocols/code 的可用性
评估相对 existing approaches 的改进
检查是否有足够细节可供实现

Short Reports/Letters

根据篇幅简短调整期望
确保 core findings 仍然 rigorous 且 significant
验证 format 是否适合 findings

Preprints

认识到它们尚未经过正式 peer review
可能比 journal submissions 打磨程度更低
仍需对 scientific validity 应用严格标准
考虑提供 constructive feedback，帮助作者在 journal submission 前改进

Presentations 和 Slide Decks

⚠️ 关键：对于 presentations，绝不要直接读取 PDF。始终先转换为 images。

审阅 scientific presentations（PowerPoint、Beamer、slide decks）时：

强制 Image-Based Review Workflow

绝不要尝试直接读取 presentation PDFs - 这会导致 buffer overflow errors，并且无法显示 visual formatting issues。

必需流程：

使用 Python 将 PDF 转换为 images：

python skills/scientific-slides/scripts/pdf_to_images.py presentation.pdf review/slide --dpi 150
# Creates: review/slide-001.jpg, review/slide-002.jpg, etc.

按顺序读取并检查每一个 slide image file
用具体 slide numbers 记录问题
提供关于 visual formatting 和 content 的 feedback

开始 review 时打印：

[HH:MM:SS] PEER REVIEW: Presentation detected - converting to images for review
[HH:MM:SS] PDF REVIEW: NEVER reading PDF directly - using image-based inspection

Presentation-Specific Evaluation Criteria

Visual Design and Readability：

Text 足够大（body text 最小 18pt，理想为 24pt+）
text 与 background 之间有 high contrast（最低 4.5:1，首选 7:1）
Color scheme 专业且 colorblind-accessible
所有 slides 的 visual design 一致
White space 充分（不拥挤）
Fonts 清楚且专业

Layout and Formatting（检查每张 Slide Image）：

slide edges 处没有 text overflow 或 truncation
没有 element overlaps（text over images、overlapping shapes）
Titles 位置一致
Content 正确对齐
Bullets 和 text 没有被截断
Figures 位于 slide boundaries 内
Captions 和 labels 可见且可读

Content Quality：

每张 slide 一个 main idea（不过载）
Text 最少化（每张 slide 最多 3-6 个 bullets）
Bullet points 简洁（每条 5-7 个词）
Figures 简化且清楚（不是从论文中 copy-pasted）
Data visualizations 具有大且可读的 labels
Citations 存在且格式正确
Results/data slides 在 presentation 中占主导（40-50% 的内容）

Structure and Flow：

清楚的 narrative arc（introduction → methods → results → discussion）
slides 之间逻辑递进
slide count 适合 talk duration（约每分钟 1 张 slide）
Title slide 包含 authors、affiliation、date
Introduction 引用相关 background literature（3-5 papers）
Discussion 引用 comparison papers（3-5 papers）
Conclusions slide 总结 key findings
末尾有 acknowledgments/funding slide

Scientific Content：

Research question 清楚陈述
Methods 适当概括（不过度详细）
Results 以清楚 visualizations 逻辑呈现
Statistical significance 标注合适
Conclusions 由所展示 data 支持
在合适位置承认 limitations
讨论 future directions 或 broader impact

需要标记的常见 Presentation Issues：

Critical Issues（必须修复）：

Text overflow 导致内容不可读
Font sizes 太小（<18pt）
Element overlaps 遮挡 data
Contrast 不足（text 难以阅读）
Figures 过于复杂或不可辨认
无 citations（claims 完全无支持）
Slide count 与 duration 严重不匹配

Major Issues（应修复）：

slides 之间 design 不一致
text 过多（大段文字，而不是 bullets）
figures 简化不足（axis labels 太小）
layout 拥挤，white space 不足
缺少关键 structural elements（没有 conclusion slide）
color choices 不佳（非 colorblind-safe）
results content 过少（<30% slides）

Minor Issues（改进建议）：

可使用更多 visuals/diagrams
部分 slides text 稍多
轻微 alignment inconsistencies
可从更多 white space 中受益
additional citations 会加强 claims
color scheme 可更现代

Presentations 的 Review Report Format

Summary Statement：

对 presentation quality 的 overall impression
对 target audience 和 duration 的适配性
Key strengths（visual design、content、clarity）
Key weaknesses（formatting issues、content gaps）
Recommendation（ready to present、minor revisions、major revisions）

Layout and Formatting Issues（按 Slide Number）：

Slide 3: Text overflow - bullet point 4 extends beyond right margin
Slide 7: Element overlap - figure overlaps with caption text
Slide 12: Font size - axis labels too small to read from distance
Slide 18: Alignment - title not centered

Content and Structure Feedback：

background context 和 citations 是否充分
research question 和 objectives 是否清楚
methods summary 的质量
results presentation 的有效性
conclusions 和 implications 的力度

Design and Accessibility：

整体 visual appeal 和 professionalism
Color contrast 和 readability
Colorblind accessibility
slides 之间的一致性

Timing and Scope：

slide count 是否匹配 intended duration
detail level 是否适合 talk type
sections 之间的平衡

Image-Based Review Process 示例

[14:30:00] PEER REVIEW: Starting review of presentation
[14:30:05] PEER REVIEW: Presentation detected - converting to images
[14:30:10] PDF REVIEW: Running pdf_to_images.py on presentation.pdf
[14:30:15] PDF REVIEW: Converted 25 slides to images in review/ directory
[14:30:20] PDF REVIEW: Inspecting slide 1/25 - title slide
[14:30:25] PDF REVIEW: Inspecting slide 2/25 - introduction
...
[14:35:40] PDF REVIEW: Inspecting slide 25/25 - acknowledgments
[14:35:45] PDF REVIEW: Completed image-based review
[14:35:50] PEER REVIEW: Found 8 layout issues, 3 content issues
[14:35:55] PEER REVIEW: Generating structured feedback by slide number

记住： 对于 presentations，通过 images 进行 visual inspection 是强制性的。绝不要尝试把 presentation PDFs 当作 text 阅读，这会失败并漏掉所有 visual formatting issues。

资源

此 skill 包含支持 comprehensive peer review 的参考材料：

references/reporting_standards.md

跨学科 major reporting standards（CONSORT、PRISMA、ARRIVE、MIAME、STROBE 等）的 guidelines，用于评估 methods 和 results reporting 的完整性。

references/common_issues.md

peer review 中常见 methodological 和 statistical issues 的目录，并提供识别和处理这些问题的指南。

最终 Checklist

在完成 review 前，验证：

Summary statement 清楚传达 overall assessment
Major concerns 被清楚识别并论证
Suggested revisions 具体且可执行
Minor issues 已记录且分类恰当
Statistical methods 已评估
Reproducibility 和 data availability 已评估
Ethical considerations 已验证
Figures 和 tables 的 quality 与 integrity 已评估
Writing quality 已评估
全文 tone 建设性且专业
Review 彻底，但与 manuscript scope 成比例
Recommendation 与已识别问题一致