Change Your Voice with AI
No se fíe sólo de nuestra palabra: en las pruebas ciegas de preferencia humana, PlayDialog superó al modelo líder del sector en una proporción de 3 a 1.
Nuestros modelos TTS de baja latencia tienen un TTFA (tiempo hasta el primer audio) tan bajo como 125 ms a través de nuestra API, e incluso menos si necesita una solución local.
Nuestros modelos de voz están afinados para manejar con precisión, ritmo y entonación complejos acrónimos y secuencias numéricas como tarjetas de crédito y números de teléfono.
Nuestro modelo Play 3.0 mini es compatible con 30 idiomas, muchos de ellos con voz masculina y femenina.
Todos los modelos de IA de voz son fáciles de usar a través de nuestras API y SDK, y admiten websockets y SIP trunking. Pon en marcha tu aplicación de voz en horas, no en semanas.
const options = {
method: 'POST',
headers: {
AUTHORIZATION: '<api-key>',
'X-USER-ID': '<api-key>',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'PlayDialog',
text: `Country Mouse: Welcome to my humble home, cousin!
Town Mouse: Thank you, cousin. It's quite... peaceful here.
Country Mouse: It is indeed. I hope you're hungry.
I've prepared a simple meal of beans, barley, and fresh roots.
Town Mouse: Well, it's... earthy. Do you eat this every day?`,
voice: 's3://voice-cloning-zero-shot/baf1ef41-36b6-428c-9bdf-50ba54682bd8/original/manifest.json',
voice2: 's3://voice-cloning-zero-shot/baf1ef41-36b6-428c-9bdf-50ba54682bd8/original/manifest.json',
outputFormat: 'mp3',
speed: 1,
sampleRate: 44100,
seed: null,
temperature: null,
turnPrefix: 'Country Mouse:',
turnPrefix2: 'Town Mouse:',
prompt: '<string>',
prompt2: '<string>',
voiceConditioningSeconds: 20,
voiceConditioningSeconds2: 20,
language: 'english',
webHookUrl: '<string>',
}),
};
fetch('https://api.play.ai/api/v1/tts', options)
.then(response => response.json())
.then(response => console.log(response))
.catch(err => console.error(err));
Nuestra plataforma protege los datos en reposo y en tránsito, y cumplimos las normas ISO 27001, GDPR y SOC 2 tipo II. Admitimos despliegues on-prem para las aplicaciones más exigentes.
Los modelos de voz TTS de Play lideran el sector en calidad de voz, prosodia y entonación.
Con Play 3.0 mini, el tiempo transcurrido hasta la primera señal de audio es de tan sólo 125 ms, o menos si es necesaria una implantación local.
Generación y personalización de IA por voz, todo ello mediante API fáciles de usar.
El diálogo se ajusta para garantizar la generación precisa de acrónimos y secuencias numéricas (por ejemplo, números de teléfono o de tarjetas de crédito).
Totalmente compatible con inglés, español y árabe; más de 25 idiomas en desarrollo.
Todos los modelos cumplen con GDPR, ISO 27001 y SOC 2 tipo II. También disponible en local.