Change Your Voice with AI
टीमों द्वारा विश्वसनीय
“NextKast ने हमारे रेडियो स्टेशन ग्राहकों के लिए PlayAI डायलॉग आवाज़ों का उपयोग करके एक पूरी तरह से स्वचालित AI डीजे बनाया। हमें ये आवाज़ें कितनी अभिव्यक्तिशील, भावनात्मक और प्राकृतिक लगती हैं, यह बहुत पसंद है, और हमने बाजार में इसके समान कुछ और नहीं पाया। रेडियो में, अपने श्रोताओं को व्यस्त रखना ही सब कुछ है, और Play की आवाज़ें यह करती हैं।”
विन्सटन पोटगिएटर, संस्थापक, एक्सिस एंटरटेनमेंट
< 320ms विलंबता
मल्टी-टर्न बातचीत के लिए अनुकूलित
गतिशील स्वरछंद और भावनाएँ
ऑन-प्रेम पर परिनियोज्य
आकर्षक और भावनात्मक AI कथन, पॉडकास्ट और ऑडियोबुक बनाएं, या अल्ट्रा-यथार्थवादी वॉयस एजेंट्स को शक्ति प्रदान करें। डायलॉग प्रत्येक वार्तालाप के मोड़ को समझता है और सही स्वरछंद, गति और भावना के साथ भाषण उत्पन्न करता है।
पिछले वॉयस AI मॉडलों के विपरीत, PlayDialog एक बातचीत के पूरे संवादात्मक संदर्भ को इनपुट के रूप में उपयोग करता है, जिसका मतलब है कि कथन और बहु-पक्षीय बातचीत तरल, आकर्षक और प्राकृतिक लगती हैं, साथ ही उत्कृष्ट स्वरछंद, गति और स्वरांश के साथ।
हमारी उद्योग-प्रमुख वॉयस क्लोनिंग क्षमताओं का मतलब है कि PlayDialog के साथ, आपको एक सटीक पुनरुत्पादन मिलता है जो मूल से मुश्किल से भिन्न होता है। हर बार कथन, पॉडकास्ट, डबिंग को सटीक रूप से बनाएं।
परीक्षण में डायलॉग को उद्योग के सबसे प्रसिद्ध मॉडल के मुकाबले 3:1 की पसंद दी गई, जिसमें भावना, गुणवत्ता और सटीकता में जीत हासिल की। इसे आज़माएं और अंतर अनुभव करें।
import axios from 'axios';
import dotenv from 'dotenv';
dotenv.config();
// Set up headers with your API secret key and user ID
const userId = process.env.PLAYDIALOG_USER_ID;
const secretKey = process.env.PLAYDIALOG_SECRET_KEY;
const headers = {
'X-USER-ID': userId,
Authorization: secretKey,
'Content-Type': 'application/json',
};
// Define the model
const model = 'PlayDialog';
// Define voices for the 2 hosts
// Find all voices here https://docs.play.ai/tts-api-reference/voices
const voice1 = 's3://voice-cloning-zero-shot/baf1ef41-36b6-428c-9bdf-50ba54682bd8/original/manifest.json';
const voice2 = 's3://voice-cloning-zero-shot/e040bd1b-f190-4bdb-83f0-75ef85b18f84/original/manifest.json';
// Podcast transcript should be in the format of Host 1: ... Host 2:
const transcript = `
Host 1: Welcome to The Tech Tomorrow Podcast! Today we're diving into the fascinating world of voice AI and what the future holds.
Host 2: And what a topic this is. The technology has come so far from those early days of basic voice commands.
Host 1: Remember when we thought it was revolutionary just to ask our phones to set a timer?
Host 2: Now we're having full conversations with AI that can understand context, emotion, and even cultural nuances. It's incredible.
Host 1: Though it does raise some interesting questions about privacy and ethics. Where do we draw the line?
Host 2: Exactly. The potential benefits for accessibility and education are huge, but we need to be thoughtful about implementation.
Host 1: Well, we'll be exploring all of these aspects today. Stay with us as we break down the future of voice AI.
`;
const payload = {
model,
text: transcript,
voice: voice1,
voice2: voice2,
turnPrefix: 'Host 1:',
turnPrefix2: 'Host 2:',
outputFormat: 'mp3',
};
// Send the POST request to trigger podcast generation
const response = await axios.post('https://api.play.ai/api/v1/tts/', payload, { headers });
// Get the job ID to check the status
const jobId = response.data.id;
if (!jobId) {
throw new Error('Job ID not returned by API');
}
// Use the job ID to check completion status
const url = `https://api.play.ai/api/v1/tts/${jobId}`;
const delaySeconds = 2000;
// Keep checking until status is COMPLETED.
// Longer transcripts take more time to complete.
let podcastAudio = null;
while (!podcastAudio) {
const statusResponse = await axios.get(url, { headers });
const status = statusResponse.data.output?.status;
console.log(status);
if (status === 'COMPLETED') {
// Once completed, audio URL will be available
podcastAudio = statusResponse.data.output.url;
} else {
await new Promise((resolve) => setTimeout(resolve, delaySeconds));
}
}
console.log('Podcast audio URL:', podcastAudio);
PlayDialog उपयोग में आसान है और हमारे API के माध्यम से और Fal जैसे प्लेटफार्मों पर उपलब्ध है। यह Websockets और LLMs से स्ट्रीमिंग का भी समर्थन करता है।
PlayAI के मॉडल जहाँ आपको चाहिए, वहाँ जाते हैं, जिसमें सबसे उच्च सुरक्षा वाले अनुप्रयोगों के लिए ऑन-प्रेम भी शामिल है।
डायलॉग GDPR, SOC 2 टाइप II, और ISO2700 के अनुरूप है। सभी मॉडल क्लाउड प्लेटफार्मों या ऑन-प्रेम पर सबसे अधिक मांग वाले एंटरप्राइज़ अनुप्रयोगों के लिए अनुरोध पर उपलब्ध हैं।
Play के TTS वॉयस मॉडल्स आवाज़ की गुणवत्ता, प्रोसोदी औरintonation में उद्योग में नेतृत्व करते हैं।
पहली ऑडियो तक का समय 320ms तक कम, यदि ऑन-प्रेम डिप्लॉयमेंट की आवश्यकता हो तो इससे भी कम।
वॉयस आईए जनरेशन और कस्टमाइजेशन सभी उपयोग में आसान APIs द्वारा समर्थित हैं।
संवाद को इस प्रकार समायोजित किया गया है कि संक्षेपाक्षरों, संख्यात्मक अनुक्रमों (जैसे, फोन नंबर, क्रेडिट कार्ड नंबर) की सटीक उत्पत्ति सुनिश्चित की जा सके।
इंग्लिश, स्पैनिश, अरबी पूरी तरह से समर्थित; 25+ भाषाएँ विकासाधीन हैं।
सभी मॉडल GDPR, ISO 27001 और SOC 2 टाइप II के अनुरूप हैं। ऑन-प्रेम भी उपलब्ध है।
यदि आपके पास कोई एंटरप्राइज़ उपयोग मामला है, तो हमें सुनकर खुशी होगी।