Edit Speech with AI
Não acredite apenas na nossa palavra - Em testes cegos de preferência humana, o PlayDialog venceu o modelo líder da indústria por 3:1
Os nossos modelos TTS de baixa latência têm um TTFA (Tempo para o primeiro áudio) tão baixo como 125 ms através da nossa API, e ainda menos se necessitar de uma solução no local.
Os nossos modelos de voz estão aperfeiçoados para lidar com acrónimos complexos e sequências numéricas, como cartões de crédito e números de telefone, com precisão, ritmo e entoação corretos
O nosso modelo Play 3.0 mini é compatível com 30 idiomas, muitos deles com várias vozes masculinas e femininas de origem
Todos os modelos de IA de voz são fáceis de utilizar através das nossas APIs e SDKs e suportam websockets e entroncamento SIP. Ponha a sua aplicação de voz a funcionar em horas e não em semanas.
const options = {
method: 'POST',
headers: {
AUTHORIZATION: '<api-key>',
'X-USER-ID': '<api-key>',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'PlayDialog',
text: `Country Mouse: Welcome to my humble home, cousin!
Town Mouse: Thank you, cousin. It's quite... peaceful here.
Country Mouse: It is indeed. I hope you're hungry.
I've prepared a simple meal of beans, barley, and fresh roots.
Town Mouse: Well, it's... earthy. Do you eat this every day?`,
voice: 's3://voice-cloning-zero-shot/baf1ef41-36b6-428c-9bdf-50ba54682bd8/original/manifest.json',
voice2: 's3://voice-cloning-zero-shot/baf1ef41-36b6-428c-9bdf-50ba54682bd8/original/manifest.json',
outputFormat: 'mp3',
speed: 1,
sampleRate: 44100,
seed: null,
temperature: null,
turnPrefix: 'Country Mouse:',
turnPrefix2: 'Town Mouse:',
prompt: '<string>',
prompt2: '<string>',
voiceConditioningSeconds: 20,
voiceConditioningSeconds2: 20,
language: 'english',
webHookUrl: '<string>',
}),
};
fetch('https://api.play.ai/api/v1/tts', options)
.then(response => response.json())
.then(response => console.log(response))
.catch(err => console.error(err));
A nossa plataforma protege os dados em repouso e em trânsito, e estamos em conformidade com as normas ISO 27001, GDPR e SOC 2 tipo II. Suportamos implementações no local para as aplicações mais exigentes
Os modelos de voz TTS da Play são líderes no sector em termos de qualidade de voz, prosódia e entoação.
Tempo para o primeiro áudio tão baixo como 125 ms com o Play 3.0 mini, menos se for necessária uma implementação no local
Geração e personalização de IA de voz, tudo suportado por APIs fáceis de utilizar.
O diálogo é aperfeiçoado para garantir a geração exacta de acrónimos e sequências numéricas (por exemplo, números de telefone e de cartão de crédito).
Suporte total para inglês, espanhol e árabe; mais de 25 idiomas em desenvolvimento
Todos os modelos são compatíveis com GDPR, ISO 27001 e SOC 2 tipo II. Também disponível no local.