Command Palette
Search for a command to run...
VibeVoice
VibeVoice es la familia de modelos de voz de código abierto de Microsoft Research, con text-to-speech multilocutor y reconocimiento de voz basados en tokenizers continuos de ultra baja frecuencia (7.5 Hz). Incluye tres modelos con licencia MIT: uno ASR de 7B para más de 50 idiomas con clips de hasta 60 minutos, uno TTS de 1.5B que genera hasta 90 minutos de audio con 4 locutores, y uno de 0.5B en tiempo real para 9 idiomas. Se despliega en Hugging Face, Google Colab o vLLM, pensado para investigadores y desarrolladores que necesitan síntesis de voz larga y multilocutor para podcasts y audio conversacional.
Precios
Plataformas
Este espacio está disponible para publicidad
Llega a desarrolladores, diseñadores y creadores curiosos que navegan recursos de internet seleccionados. Contáctanos para patrocinar este espacio.