name: generate-transparent-image description: 背景透過された画像を生成する。Gemini APIで画像生成後、WaveSpeed AI (Bria) で背景を自動透過。透過PNG、切り抜き画像、背景なし画像の生成に使用。
背景透過画像生成スキル
Gemini APIで画像を生成し、WaveSpeed AI (Bria Remove Background) で背景を自動透過します。1回の指示で背景透過済みの画像を生成できます。
機能
- テキストプロンプトから画像を生成
- WaveSpeed AI (Bria) で高精度な背景透過
- PNG形式(アルファチャンネル付き)で出力
環境変数
以下の環境変数が設定されている必要があります:
GEMINI_API_KEY- Gemini APIキーWAVESPEED_API_KEY- WaveSpeed AIキー
プロンプトの書き方
重要: 画像生成プロンプトには必ず「背景透過画像を生成」という指示を含めてください。
これにより、Gemini APIが背景がシンプルな画像を生成しやすくなり、PhotoRoomによる背景透過の精度が向上します。
プロンプト例
# 良い例
"背景透過画像を生成: 可愛い赤ちゃん、実写風"
"背景透過画像を生成: マレーシアのナシレマ、フードフォトグラフィ"
"背景透過画像を生成: 白い猫、isolated on white background"
# 悪い例(背景透過の指示がない)
"可愛い赤ちゃん"
"マレーシアのナシレマ"
推奨フォーマット
背景透過画像を生成: [被写体の説明], [スタイル指定(実写風、イラスト風など)]
実行方法
.claude/skills/generate-transparent-image/.venv/bin/python .claude/skills/generate-transparent-image/scripts/generate_transparent.py "<プロンプト>" -o <出力ファイル>
使用例
# 基本的な使い方
.claude/skills/generate-transparent-image/.venv/bin/python .claude/skills/generate-transparent-image/scripts/generate_transparent.py "背景透過画像を生成: 可愛い赤ちゃん、実写風" -o baby.png
# アスペクト比を指定
.claude/skills/generate-transparent-image/.venv/bin/python .claude/skills/generate-transparent-image/scripts/generate_transparent.py "背景透過画像を生成: 白い猫、実写風フォトグラフィ" --aspect-ratio 3:4 -o cat.png
# 正方形で生成
.claude/skills/generate-transparent-image/.venv/bin/python .claude/skills/generate-transparent-image/scripts/generate_transparent.py "背景透過画像を生成: 赤いりんご、プロダクトフォト" --aspect-ratio 1:1 -o apple.png
参照画像を使った編集
既存の画像を参照して、スタイル変換や編集が可能です。
# 画像をアニメ風に変換
.claude/skills/generate-transparent-image/.venv/bin/python .claude/skills/generate-transparent-image/scripts/generate_transparent.py "この画像をアニメ風に変換" -r input.png -o anime.png
# 複数の画像を参照
.claude/skills/generate-transparent-image/.venv/bin/python .claude/skills/generate-transparent-image/scripts/generate_transparent.py "これらの画像を合成して新しいキャラクターを作成" -r ref1.png -r ref2.png -o merged.png
# 既存キャラクターの背景透過版を生成
.claude/skills/generate-transparent-image/.venv/bin/python .claude/skills/generate-transparent-image/scripts/generate_transparent.py "背景透過画像を生成: このキャラクターを同じスタイルで" -r character.png -o transparent_char.png
参照画像のサポート形式
- PNG(
.png) - JPEG(
.jpg,.jpeg) - GIF(
.gif) - WebP(
.webp)
オプション
| オプション | 説明 |
|---|---|
-o, --output |
出力ファイルのパス(デフォルト: output.png) |
--aspect-ratio |
アスペクト比(1:1, 16:9, 3:4, 4:3, 9:16 など) |
-r, --reference |
参照画像のパス(複数指定可能) |
アスペクト比
指定可能な値: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
環境セットアップ
Python 3.10の仮想環境が必要です。初回セットアップ:
cd .claude/skills/generate-transparent-image
uv venv --python 3.10 .venv
uv pip install requests pillow -p .venv
処理の流れ
- Gemini API(gemini-3-pro-image-preview)で画像生成
- WaveSpeed AIに画像をアップロード
- Bria Remove Background APIで背景を自動検出・透過
- PNG形式で保存
WaveSpeed AI APIについて
- アップロード:
POST https://api.wavespeed.ai/api/v3/media/upload/binary - 背景除去:
POST https://api.wavespeed.ai/api/v3/bria/remove-background - 対応フォーマット: PNG, JPEG, WebP, GIF
- 高精度な被写体検出と背景透過
- API料金: 1回あたり約$0.018
注意事項
- 生成された画像の著作権やライセンスについてはGoogleの利用規約を確認してください
- WaveSpeed AI APIの利用にはAPIキーが必要です(https://wavespeed.ai から取得)
トラブルシューティング
仮想環境の再作成
cd .claude/skills/generate-transparent-image
rm -rf .venv
uv venv --python 3.10 .venv
uv pip install requests pillow -p .venv
APIキーに特殊文字が含まれる場合
GEMINI_API_KEYやWAVESPEED_API_KEYに特殊文字(+, /, =など)が含まれている場合、curlコマンドでエラーが発生することがあります。
解決策: 本スキルはPythonスクリプトを使用しているため、この問題は発生しません。
DNS解決エラー
仮想環境からネットワークアクセスができない場合:
Failed to resolve 'generativelanguage.googleapis.com'
原因: 仮想環境のPythonがシステムのDNS設定を正しく参照できていない
解決策: システムのPythonを使用するか、仮想環境を再作成してください。