name: img2pdf homepage: https://github.com/cat-xierluo/legal-skills author: 杨卫薪律师(微信ywxlaw) version: "1.2.0" description: 将图片或 PDF 页面按 N 张/页编排为标准化 A4 PDF,或将长截图渲染为单张自适应高度 PDF。本技能应在用户需要将截图(手机截图、视频截图)、照片、已有 PDF 页面或长截图(微信聊天、庭审笔录)合并为 PDF 时使用。不要用于:OCR 文字识别、PDF 内容编辑、图片格式转换。 license: MIT
img2pdf
定位
本技能解决"大量截图/照片需要编排为紧凑 PDF 提交"以及"超长截图(微信聊天、庭审笔录)需要保留上下逻辑转为 PDF"的问题。核心场景是法律证据材料整理。
核心职责:
- 将图片目录或多个图片文件编排为 A4 PDF,支持 1/2/3/4 张每页。
- 将已有 PDF 的每页重新编排为 N 张每页的紧凑布局。
- 自动检测图片横竖方向,选择合适的 A4 页面方向。
- 可配置页边距,确保打印效果良好。
- v1.2.0 长截图模式:按 A4 比例自动切割超长图再编排(微信聊天场景),或将整张长图渲染为单张自适应高度 PDF(庭审笔录场景)。
本技能不做 OCR、不编辑 PDF 内容、不处理视频文件。若需要从视频提取截图,先使用 video-screenshot。
与其他技能配合
- 上游:video-screenshot 提取视频截图后,用本技能编排为 PDF。
- 上游:截图工具(手机截图、浏览器截图)产出的图片文件。
- 下游:pdf-organizer 可对编排后的 PDF 做进一步整理(拆分、合并、命名)。
- 替代:pdf-organizer 的
--normalize-a4只做页面标准化,不做多图编排。
依赖
系统依赖
无额外系统依赖。
Python 包
| 包名 | 用途 | 安装命令 |
|---|---|---|
pypdf>=4.0.0 |
PDF 页面变换与合并 | python3 -m pip install -r scripts/requirements.txt |
Pillow>=10.0.0 |
图片格式检测 | 同上 |
PyMuPDF>=1.24.0 |
图片转 PDF 页面 | 同上 |
输入/输出
输入
- 图片目录:扫描目录下所有 JPG/PNG/WebP 文件。
- 多个图片文件:直接列出图片路径。
- 已有 PDF:将 PDF 每页当作图片重新编排。
输出
- 单个 A4 PDF 文件,每页包含 1-4 张图片,等比缩放居中。
工作流程
1. 收集输入
根据 --input 参数收集图片或 PDF 文件。如果是目录,扫描其中所有支持格式的图片。按文件名或修改时间排序。
2. 转换为页面
- 图片文件:通过 PyMuPDF 转为单页 PDF。
- PDF 文件:读取每一页作为独立页面。
3. 计算布局
根据 --per-page 和页面方向计算每张图片的可用区域:
per-page=1:整页减去边距,横竖由图片方向决定。per-page=1:整页减去边距,横竖由图片方向决定。per-page=2:A4 横版,左右两列。per-page=3:A4 横版,三列并排。per-page=4:A4 横版或竖版,2×2 网格。per-page=auto(默认):竖版图多 → 3张/页,横版图多 → 1张/页。
每张图片等比缩放适配其可用区域,居中放置。
4. 生成 PDF
将编排后的页面写入输出 PDF。不修改任何原始文件。
执行脚本
首次使用时安装依赖:
python3 -m pip install -r scripts/requirements.txt
手机截图(自动 3 张/页)
python3 scripts/img_to_pdf.py \
--input /path/to/screenshots/ \
--output /path/to/output.pdf
# 自动检测:竖版图多 → 3张/页
电脑截图(自动 1 张/页)
python3 scripts/img_to_pdf.py \
--input /path/to/desktop-screenshots/ \
--output /path/to/output.pdf
# 自动检测:横版图多 → 1张/页(A4横版)
手机截图 2 张/页(A4 横版左右并排)
python3 scripts/img_to_pdf.py \
--input /path/to/screenshots/ \
--output /path/to/output.pdf \
--per-page 2
视频截图 3 张/页
python3 scripts/img_to_pdf.py \
--input /path/to/frames/ \
--output /path/to/output.pdf \
--per-page 3
已有 PDF 重新编排
python3 scripts/img_to_pdf.py \
--input /path/to/original.pdf \
--output /path/to/repacked.pdf \
--per-page 2
多个图片文件
python3 scripts/img_to_pdf.py \
--input img1.jpg img2.jpg img3.png \
--output /path/to/output.pdf \
--per-page 3
微信聊天长截图(v1.2.0,按 A4 比例自动切 + 3 张/页)
python3 scripts/img_to_pdf.py \
--input /path/to/wechat_long.png \
--output /path/to/wechat.pdf \
--split \
--per-page 3
# 1080×6000 → 按 1080×√2≈1527px 切 4 段 → 2 页 A4 横版
微信聊天长截图(显式切割段高)
python3 scripts/img_to_pdf.py \
--input /path/to/wechat_long.png \
--output /path/to/wechat.pdf \
--split \
--split-height 1500 \
--per-page 3
庭审笔录长截图(v1.2.0 vertical 模式,整图一长页)
python3 scripts/img_to_pdf.py \
--input /path/to/transcript.png \
--output /path/to/transcript.pdf \
--mode vertical
# 不切割,1080×5000 → 1 页 595×2573pt
# 页面高度按图等比缩放,保留上下逻辑
预览(不写入文件)
python3 scripts/img_to_pdf.py \
--input /path/to/dir/ \
--per-page 2 \
--dry-run
常用参数
| 参数 | 说明 | 默认值 |
|---|---|---|
--input / -i |
图片文件、PDF 文件或目录(必填) | - |
--output / -o |
输出 PDF 路径 | <输入名>_编排.pdf |
--mode |
编排模式:nup(N 张/页)或 vertical(单图一长页) |
nup |
--per-page / -n |
nup 模式下每页图片数:1/2/3/4,或省略自动 |
auto(竖版3张,横版1张) |
--margin / -m |
页边距(pt) | 25 |
--orientation |
nup 模式页面方向:auto/landscape/portrait |
auto |
--sort |
排序:name/time/none |
name |
--split |
启用长截图切割(nup 模式) | 关闭 |
--split-height |
切割段高(px);不传 = 按 A4 比例(图宽 × √2);vertical 模式忽略 |
A4 比例 |
--dry-run |
仅预览不输出 | false |
两种模式对照
| 维度 | nup | vertical |
|---|---|---|
| 是否切割 | 视 --split 而定 |
不切(强制) |
| 每页图数 | 1/2/3/4 | 必为 1 |
| 页面尺寸 | A4 固定 | 宽度固定 A4 595pt,高度按图等比 |
| 适用场景 | 微信聊天、视频截图、证据照片 | 庭审笔录、单页长截图 |
交付检查
完成后检查:
- 输出 PDF 页数 = ceil(总图片数 / per-page)(nup 模式)或 = 图片数(vertical 模式)。
- 每页图片清晰可读,没有超出页面边界。
- 页边距合理,打印时不会裁切内容。
- 横竖方向正确(手机截图横版并排,视频截图三列等)。
- 原始图片和 PDF 未被修改或删除。
- 长截图模式:切割段高符合
--split-height或 A4 比例默认;vertical 模式页面高度 = 图高 × (A4 宽 - 2×margin) / 图宽 + 2×margin。 - vertical 模式:临时目录已清理(
/tmp/img2pdf-splits-*不残留)。