name: whisper description: 動画/音声ファイルからSRT字幕を生成。Faster Whisperによるローカル音声認識で、ファイルパスまたはURL(YouTube等)から文字起こし・翻訳が可能。「文字起こし」「字幕生成」「transcribe」「SRT」などのリクエスト時に使用。
Whisper 文字起こしスキル
動画/音声ファイルからSRT形式の字幕を生成する。
重要事項
処理は数分〜数十分かかる。MCPツール呼び出し後、必ず完了まで待機すること。途中で処理を止めない。
ワークフロー
- 入力を確認(ファイルパス or URL)
- 適切なMCPツールを呼び出す
- 完了まで待機(途中で止めない)
- 結果を報告
MCPツール
transcribe_from_file
ローカルファイルから字幕生成。
file_path: ファイルの絶対パス(必須)
device: "cuda" or "cpu"(デフォルト: cuda)
transcribe_from_url
URLから動画をダウンロードして字幕生成。
url: 動画URL(必須)
device: "cuda" or "cpu"(デフォルト: cuda)
共通オプション
input_lang: 入力言語(省略で自動検知)output_lang: 翻訳先言語(省略で翻訳なし)
詳細パラメータは parameters.md を参照。
結果報告
成功時:
字幕ファイルを生成しました:
- 原文: {srt_path}
- 翻訳: {translated_srt_path}(翻訳時のみ)
- 検出言語: {detected_language}
- セグメント数: {segment_count}
失敗時:
エラーが発生しました: {error}