voicevox

star 3

VOICEVOX Engineを使って日本語音声合成を行うスキル。テキストから自然な日本語音声を生成する。

Sunwood-AI-OSS-Hub By Sunwood-AI-OSS-Hub schedule Updated 2/5/2026

name: voicevox description: VOICEVOX Engineを使って日本語音声合成を行うスキル。テキストから自然な日本語音声を生成する。 triggers: - "音声を作" - "音声を生成" - "音声合成" - "voicevox" - "VOICEVOX" - "ナレーション" - "読み上げ"

VOICEVOX Skill

VOICEVOX Engineを使って日本語音声を合成するスキル。テキストから自然な日本語音声(WAV形式)を生成します。

機能

  • テキスト読み上げ: 日本語テキストから音声を生成
  • 話者選択: 複数のキャラクター(四国めたん、ずんだもん等)から選択可能
  • パラメータ調整: 速度、ピッチ、音量、イントネーションを調整
  • 話者一覧: 利用可能な話者とスタイルの一覧表示

クイックスタート

前提条件

VOICEVOX EngineがDockerコンテナで実行されている必要があります:

docker-compose up -d

Engineは http://127.0.0.1:50021 で利用可能になります。

基本的な使用方法

「この文章を読み上げて」
「音声を生成して」
「『こんにちは、世界』という音声を作って」

使用方法

1. 音声生成

基本の音声生成:

python3 .claude/skills/voicevox/scripts/voicevox_client.py "こんにちは、世界" -o output.wav

話者を指定して生成:

python3 .claude/skills/voicevox/scripts/voicevox_client.py "こんにちは" -s 1 -o output.wav

2. パラメータ調整

速度、ピッチ、音量を調整:

python3 .claude/skills/voicevox/scripts/voicevox_client.py "テスト" \
  --speed 1.2 \
  --pitch 0.1 \
  --volume 1.5 \
  -o output.wav

3. 話者一覧の表示

利用可能な話者を確認:

python3 .claude/skills/voicevox/scripts/voicevox_client.py --list-speakers

スクリプトオプション

オプション 説明 デフォルト
text 読み上げるテキスト(必須) -
-o, --output 出力ファイルパス output.wav
-s, --speaker 話者ID 0
--speed 速度(0.5-2.0程度) 1.0
--pitch ピッチ(-0.5〜0.5程度) 0.0
--volume 音量 1.0
--host VOICEVOX Engineのホスト 127.0.0.1
--port VOICEVOX Engineのポート 50021
--list-speakers 話者一覧を表示 -

主な話者(デフォルト)

ID 名前 スタイル
0 四国めたん 普通
1 ずんだもん 普通
2 水瀬いのり 普通
3 春日部つむぎ 普通
4 波音リツ 普通

注: 話者一覧は --list-speakers で確認してください

使用例

シンプルな音声生成

python3 .claude/skills/voicevox/scripts/voicevox_client.py "こんにちは、無重星来です" -o greeting.wav

キャラクターを変える

# ずんだもん(話者ID: 1)
python3 .claude/skills/voicevox/scripts/voicevox_client.py "なのだ" -s 1 -o zundamon.wav

# 水瀬いのり(話者ID: 2)
python3 .claude/skills/voicevox/scripts/voicevox_client.py "はじめまして" -s 2 -o inori.wav

パラメータ調整

# 少し速く、高めの声
python3 .claude/skills/voicevox/scripts/voicevox_client.py "さあ、始めよう" \
  --speed 1.3 --pitch 0.2 -o cheerful.wav

# ゆっくり、落ち着いた声
python3 .claude/skills/voicevox/scripts/voicevox_client.py "じっくり考えよう" \
  --speed 0.8 --pitch -0.1 -o calm.wav

Pythonプログラムから使用

from .claude.skills.voicevox.scripts.voicevox_client import VoicevoxClient

client = VoicevoxClient()

# 音声生成
client.text_to_speech(
    "こんにちは、世界",
    "output.wav",
    speaker=0,
    speed_scale=1.0,
    pitch_scale=0.0,
    volume_scale=1.0
)

# 話者一覧を取得
speakers = client.get_speakers()
for speaker in speakers:
    print(f"{speaker['name']}: {speaker['styles']}")

出力先

音声ファイルは指定したパスに保存されます。デフォルトはカレントディレクトリの output.wav です。

エラー対処

接続エラー

エラー: VOICEVOX Engineに接続できません: http://127.0.0.1:50021
docker-compose up -d でEngineを起動してください

VOICEVOX Engineが起動していない場合は、Dockerコンテナを起動してください:

docker-compose up -d

リソース

Install via CLI
npx skills add https://github.com/Sunwood-AI-OSS-Hub/zero-cc --skill voicevox
Repository Details
star Stars 3
call_split Forks 1
navigation Branch main
article Path SKILL.md
More from Creator
Sunwood-AI-OSS-Hub
Sunwood-AI-OSS-Hub Explore all skills →