name: open-llm-vtuber description: "Compañero de voz con avatar Live2D: conversación real-time con LLMs, percepción visual, multi-LLM/TTS/ASR, desktop pet mode, completamente offline. 9.6k⭐." url: https://github.com/Open-LLM-VTuber/Open-LLM-VTuber category: ia fecha: 2026-06-05
Open-LLM-VTuber — Compañero de Voz IA
URL
https://github.com/Open-LLM-VTuber/Open-LLM-VTuber
Categoría
ia (companion IA / voz / avatar)
¿Qué hace?
Open-LLM-VTuber es un companion IA con interacción por voz en tiempo real y avatar Live2D. Puede correr completamente offline en cualquier PC.
Características principales:
- 🖥️ Cross-platform: macOS, Linux, Windows
- 🎤 Voz real-time: conversación por voz sin auriculares (AI no escucha su propia voz)
- 👁️ Percepción visual: cámara, screen recording, screenshots
- 🫱 Touch feedback: interacción por clicks y arrastres
- 😊 Live2D expressions: mapeo de emociones controlado por backend
- 🐱 Pet mode: fondo transparente, siempre visible, click-through
- 💭 Inner thoughts: ver pensamientos de la IA sin que los hable
- 🗣️ AI proactive speaking: la IA puede iniciar conversación
- 💾 Chat persistence: historial de conversaciones
Modelos soportados:
- LLM: Ollama, OpenAI, Gemini, Claude, Mistral, DeepSeek, GGUF, LM Studio, vLLM...
- ASR: sherpa-onnx, FunASR, Faster-Whisper, Whisper.cpp, Groq Whisper, Azure...
- TTS: sherpa-onnx, pyttsx3, MeloTTS, Coqui-TTS, GPTSoVITS, Bark, CosyVoice, Edge TTS...
Casos de uso
- Companion personal: asistente de voz con avatar visual
- Aprendizaje interactivo: practicar idiomas con conversación por voz
- Demo/prototipo: integrar cualquier LLM con interfaz de voz
- Productividad: asistente de escritorio con percepción visual
- Offline AI: funcionamiento 100% local sin internet
Snippets útiles
Deploy con Docker
docker run -p 7860:7860 open-llm-vtuber/open-llm-vtuber
Configurar LLM local con Ollama
# config.yaml
llm:
provider: ollama
model: llama3
base_url: http://localhost:11434
Configurar TTS con sherpa-onnx (offline)
tts:
provider: sherpa-onnx
model: vits-piper-es
Desktop Pet Mode
# Iniciar en modo desktop pet (fondo transparente)
python main.py --pet-mode
Cómo integrarlo
- Docker: imagen oficial en Docker Hub
- Local: Python + config YAML para módulos
- API: web interface con WebSocket para voz real-time
- Modular: heredar Agent interface para integrar cualquier arquitectura
Pitfalls
- v2.0 en desarrollo (rewrite completo) — v1 sigue con bugs pero funcional
- Para uso remoto (servidor en PC, acceso desde móvil) se requiere HTTPS (Web Audio API necesita secure context)
- Long-term memory temporalmente removido (en desarrollo para v2)
- Microphone requiere HTTPS o localhost para funcionar (Web Audio API restriction)
- Live2D models requieren configuración manual para importar custom models
Fecha de descubrimiento
2026-06-05 (trending diario + 9.6k⭐)