Command Palette

Search for a command to run...

VibeVoice

FreeSelf-hostedLinuxmacOSWindows
Visitar Sitio Web

VibeVoice es la familia de modelos de voz de código abierto de Microsoft Research, con text-to-speech multilocutor y reconocimiento de voz basados en tokenizers continuos de ultra baja frecuencia (7.5 Hz). Incluye tres modelos con licencia MIT: uno ASR de 7B para más de 50 idiomas con clips de hasta 60 minutos, uno TTS de 1.5B que genera hasta 90 minutos de audio con 4 locutores, y uno de 0.5B en tiempo real para 9 idiomas. Se despliega en Hugging Face, Google Colab o vLLM, pensado para investigadores y desarrolladores que necesitan síntesis de voz larga y multilocutor para podcasts y audio conversacional.

Precios

Free

Plataformas

Self-hosted
Linux
macOS
Windows
Anúnciate aquí

Este espacio está disponible para publicidad

Llega a desarrolladores, diseñadores y creadores curiosos que navegan recursos de internet seleccionados. Contáctanos para patrocinar este espacio.

Contactar para publicidad