paddle-build - SKILL.md Agent Skill

name: paddle-build description: Use when needing to compile, rebuild, or install Paddle from source after code changes. Covers cmake configuration, ninja incremental build, wheel packaging, and common build failure diagnosis.

Paddle 源码编译

概览

Paddle 使用 CMake + Ninja 构建。典型流程：cmake 配置 → ninja 编译 → whl 打包安装。修改 C++/CUDA 代码后需重新编译才能生效。

编译流程

1. 环境准备（venv）

cd /workspace/Paddle
uv venv --relocatable --seed --python 3.10   # 首次创建
source .venv/bin/activate
uv pip install -r python/requirements.txt
uv pip install func_timeout pandas numpy "numpy<2.0"

若 .venv 已存在，直接 source .venv/bin/activate 即可。

2. CMake 配置

mkdir -p build && cd build
cmake .. \
  -GNinja \
  -DCMAKE_BUILD_TYPE=Release \
  -DCMAKE_EXPORT_COMPILE_COMMANDS=ON \
  -DPY_VERSION=3.10 \
  -DPADDLE_VERSION=0.0.0 \
  -DCUDA_ARCH_NAME=Auto \
  -DWITH_GPU=ON \
  -DWITH_DISTRIBUTE=ON \
  -DWITH_CINN=ON \
  -DWITH_UNITY_BUILD=OFF \
  -DWITH_TESTING=OFF

配置只需首次执行或 CMake 选项变更时重新执行。

3. 编译

ninja -j$(nproc)

Ninja 自动增量编译，仅重编变更文件及其依赖。

4. 安装

cd /workspace/Paddle
uv pip install build/python/dist/*.whl --no-deps --force-reinstall

--no-deps 跳过依赖解析加速安装，--force-reinstall 确保覆盖旧版。

常用 CMake 选项

选项	默认	说明
`WITH_GPU`	ON(有CUDA时)	GPU 支持
`WITH_DISTRIBUTE`	OFF	分布式训练
`WITH_CINN`	OFF	CINN 编译器
`WITH_TESTING`	ON	C++ 单测（关闭可加速编译）
`WITH_UNITY_BUILD`	OFF	合并编译单元加速（可能掩盖头文件问题）
`CUDA_ARCH_NAME`	Auto	GPU 架构，Auto 自动检测当前卡
`CMAKE_BUILD_TYPE`	Release	Debug 可调试但更慢
`CMAKE_EXPORT_COMPILE_COMMANDS`	OFF	生成 `compile_commands.json` 供 clangd 使用
`WITH_TENSORRT`	OFF	TensorRT 推理加速
`WITH_ROCM`	OFF	AMD ROCm 支持
`WITH_XPU`	OFF	百度昆仑 XPU 支持

增量编译策略

digraph incremental {
  "修改了什么?" [shape=diamond];
  "Python 代码" [shape=box, label="无需编译\n同步源码到构建目录后测试"];
  "C++/CUDA kernel" [shape=box, label="ninja → 安装 whl"];
  "CMakeLists / cmake 选项" [shape=box, label="重新 cmake → ninja → 安装 whl"];
  "YAML (ops/backward)" [shape=box, label="ninja（触发代码生成）→ 安装 whl"];

  "修改了什么?" -> "Python 代码" [label="python/"];
  "修改了什么?" -> "C++/CUDA kernel" [label="paddle/phi/"];
  "修改了什么?" -> "CMakeLists / cmake 选项" [label="cmake/"];
  "修改了什么?" -> "YAML (ops/backward)" [label="ops.yaml 等"];
}

仅改 Python：无需编译。如果直接在 build/python 下编辑测试，改动即时生效。也可以在源码目录编辑后通过 cp python/<src> build/python/<src> 或者 cp test/<src> build/test/<src> 同步到构建目录。
改 C++/CUDA：cd build && ninja -j$(nproc) + 重新安装 whl。
改 CMake 配置：需重新 cmake .. 再 ninja。
改 YAML（ops.yaml / backward.yaml）：ninja 会自动触发代码生成脚本。

检查已有构建产物

复用已有 build 可大幅节约时间：

# 检查是否已有 whl
ls build/python/dist/*.whl 2>/dev/null && echo "已有构建产物" || echo "需要编译"

# 检查 compile_commands.json（clangd 需要）
ls build/compile_commands.json 2>/dev/null

常见编译问题

症状	原因	解决
`ninja: error: loading 'build.ninja'`	未执行 cmake 配置	先执行 cmake 命令
CUDA arch 不匹配	`CUDA_ARCH_NAME` 与实际 GPU 不符	设为 `Auto` 或指定具体架构
链接时 OOM	并行链接占用过多内存	`ninja -j4` 减少并行度
protobuf 版本冲突	系统 protobuf 与编译版本不一致	在 venv 内编译，隔离系统包
`ccache` 缓存失效导致全量重编	头文件路径变更	清理 ccache: `ccache -C`
whl 安装后 import 报错	旧 .so 残留	`--force-reinstall` 或清理 `site-packages/paddle`

完整一键编译示例

cd /workspace/Paddle
source .venv/bin/activate
cd build
ninja -j$(nproc) && cd .. && uv pip install build/python/dist/*.whl --no-deps --force-reinstall

调试编译（Debug 模式）

需要 gdb 调试 C++ 代码时，将 CMAKE_BUILD_TYPE 改为 Debug：

cmake .. -GNinja -DCMAKE_BUILD_TYPE=Debug [其他选项...]
ninja -j$(nproc)

Debug 模式编译产物更大、运行更慢，仅在需要调试时使用。

关键目录

目录	说明
`build/`	构建产物根目录
`build/python/dist/`	生成的 whl 文件
`build/compile_commands.json`	clangd 索引文件
`paddle/phi/kernels/`	PHI kernel 源码
`paddle/phi/ops/yaml/`	算子 YAML 定义
`cmake/`	CMake 模块和工具链

平台特定指南

平台	参考文档
macOS (Apple Silicon) CPU 编译	references/mac-build.md