VibeVoice Text-to-Speech Demo

Generate single or multi-speaker audio. For single-speaker monologues, the system automatically uses a specialized node with text chunking.

Text Input

Upload a short audio clip (3-30 seconds, clear audio) for each speaker you want to clone.

Speaker 1 Voice

Speaker 2 Voice

Speaker 3 Voice

Speaker 4 Voice

Generated Speech