Edit Speech with AI

डायलॉग: दुनिया का सबसे अभिव्यक्तिशील वॉयस आईए मॉडल

डायलॉग एक अत्यधिक अभिव्यक्तिशील, प्राकृतिक ध्वनि वाला वॉयस आईए मॉडल है, जो कथन, ऑडियोबुक, पॉडकास्ट और वॉयस एजेंट्स के लिए आदर्श है, जहाँ सटीक और आकर्षक संवादात्मक स्वर, स्वरछंद और भावना की आवश्यकता होती है।

टीमों द्वारा विश्वसनीय

“NextKast ने हमारे रेडियो स्टेशन ग्राहकों के लिए PlayAI डायलॉग आवाज़ों का उपयोग करके एक पूरी तरह से स्वचालित AI डीजे बनाया। हमें ये आवाज़ें कितनी अभिव्यक्तिशील, भावनात्मक और प्राकृतिक लगती हैं, यह बहुत पसंद है, और हमने बाजार में इसके समान कुछ और नहीं पाया। रेडियो में, अपने श्रोताओं को व्यस्त रखना ही सब कुछ है, और Play की आवाज़ें यह करती हैं।”

विन्सटन पोटगिएटर, संस्थापक, एक्सिस एंटरटेनमेंट

< 320ms विलंबता

मल्टी-टर्न बातचीत के लिए अनुकूलित

गतिशील स्वरछंद और भावनाएँ

ऑन-प्रेम पर परिनियोज्य

डायलॉग को क्रियावान में सुनें

आकर्षक और भावनात्मक AI कथन, पॉडकास्ट और ऑडियोबुक बनाएं, या अल्ट्रा-यथार्थवादी वॉयस एजेंट्स को शक्ति प्रदान करें। डायलॉग प्रत्येक वार्तालाप के मोड़ को समझता है और सही स्वरछंद, गति और भावना के साथ भाषण उत्पन्न करता है।

होस्टों के बीच AI पॉडकास्ट

किसी भी आवाज़ के साथ पूरा AI पॉडकास्ट उत्पन्न करें

शुरू करें

पात्रों के बीच बातचीत

कई पात्रों के बीच आकर्षक संदर्भात्मक वार्तालाप बनाएं

शुरू करें

आकर्षक वर्णन

समृद्ध नाटकीय कथात्मक सामग्री उत्पन्न करें

शुरू करें

एक दृश्य के लिए नाटकीय संवाद

नाटकीय प्रस्तुतियों उत्पन्न करने के लिए प्रेरणा और निर्देशन

शुरू करें

डायलॉग एक बातचीत के पूरे संदर्भ का उपयोग करता है

पिछले वॉयस AI मॉडलों के विपरीत, PlayDialog एक बातचीत के पूरे संवादात्मक संदर्भ को इनपुट के रूप में उपयोग करता है, जिसका मतलब है कि कथन और बहु-पक्षीय बातचीत तरल, आकर्षक और प्राकृतिक लगती हैं, साथ ही उत्कृष्ट स्वरछंद, गति और स्वरांश के साथ।

पॉडकास्ट बनाएं

डायलॉग सर्वश्रेष्ठ श्रेणी की वॉयस क्लोनिंग प्रदान करता है

हमारी उद्योग-प्रमुख वॉयस क्लोनिंग क्षमताओं का मतलब है कि PlayDialog के साथ, आपको एक सटीक पुनरुत्पादन मिलता है जो मूल से मुश्किल से भिन्न होता है। हर बार कथन, पॉडकास्ट, डबिंग को सटीक रूप से बनाएं।

दस्तावेज़ पढ़ें

डायलॉग को उद्योग के प्रमुख मॉडल के मुकाबले 3:1 की पसंद दी जाती है।

परीक्षण में डायलॉग को उद्योग के सबसे प्रसिद्ध मॉडल के मुकाबले 3:1 की पसंद दी गई, जिसमें भावना, गुणवत्ता और सटीकता में जीत हासिल की। इसे आज़माएं और अंतर अनुभव करें।

परिणाम देखें

Generate spoken audio from input text


  import axios from 'axios';
  import dotenv from 'dotenv';
  
  dotenv.config();
  
  // Set up headers with your API secret key and user ID
  const userId = process.env.PLAYDIALOG_USER_ID;
  const secretKey = process.env.PLAYDIALOG_SECRET_KEY;
  
  const headers = {
    'X-USER-ID': userId,
    Authorization: secretKey,
    'Content-Type': 'application/json',
  };
  
  // Define the model
  const model = 'PlayDialog';
  
  // Define voices for the 2 hosts
  // Find all voices here https://docs.play.ai/tts-api-reference/voices
  const voice1 = 's3://voice-cloning-zero-shot/baf1ef41-36b6-428c-9bdf-50ba54682bd8/original/manifest.json';
  const voice2 = 's3://voice-cloning-zero-shot/e040bd1b-f190-4bdb-83f0-75ef85b18f84/original/manifest.json';
  
  // Podcast transcript should be in the format of Host 1: ... Host 2:
  const transcript = `
  Host 1: Welcome to The Tech Tomorrow Podcast! Today we're diving into the fascinating world of voice AI and what the future holds.
  Host 2: And what a topic this is. The technology has come so far from those early days of basic voice commands.
  Host 1: Remember when we thought it was revolutionary just to ask our phones to set a timer?
  Host 2: Now we're having full conversations with AI that can understand context, emotion, and even cultural nuances. It's incredible.
  Host 1: Though it does raise some interesting questions about privacy and ethics. Where do we draw the line?
  Host 2: Exactly. The potential benefits for accessibility and education are huge, but we need to be thoughtful about implementation.
  Host 1: Well, we'll be exploring all of these aspects today. Stay with us as we break down the future of voice AI.
  `;
  
  const payload = {
    model,
    text: transcript,
    voice: voice1,
    voice2: voice2,
    turnPrefix: 'Host 1:',
    turnPrefix2: 'Host 2:',
    outputFormat: 'mp3',
  };
  
  // Send the POST request to trigger podcast generation
  const response = await axios.post('https://api.play.ai/api/v1/tts/', payload, { headers });
  
  // Get the job ID to check the status
  const jobId = response.data.id;
  
  if (!jobId) {
    throw new Error('Job ID not returned by API');
  }
  
  // Use the job ID to check completion status
  const url = `https://api.play.ai/api/v1/tts/${jobId}`;
  const delaySeconds = 2000;
  
  // Keep checking until status is COMPLETED.
  // Longer transcripts take more time to complete.
  let podcastAudio = null;
  while (!podcastAudio) {
    const statusResponse = await axios.get(url, { headers });
    const status = statusResponse.data.output?.status;
    console.log(status);
  
    if (status === 'COMPLETED') {
      // Once completed, audio URL will be available
      podcastAudio = statusResponse.data.output.url;
    } else {
      await new Promise((resolve) => setTimeout(resolve, delaySeconds));
    }
  }
  
  console.log('Podcast audio URL:', podcastAudio);

कोड करना आसान है

PlayDialog उपयोग में आसान है और हमारे API के माध्यम से और Fal जैसे प्लेटफार्मों पर उपलब्ध है। यह Websockets और LLMs से स्ट्रीमिंग का भी समर्थन करता है।

दस्तावेज़ पढ़ें

क्या आपको इसे ऑन-प्रेम चाहिए? कोई समस्या नहीं

PlayAI के मॉडल जहाँ आपको चाहिए, वहाँ जाते हैं, जिसमें सबसे उच्च सुरक्षा वाले अनुप्रयोगों के लिए ऑन-प्रेम भी शामिल है।

विक्रय से संपर्क करें

डायलॉग एंटरप्राइज़ के लिए तैयार है

डायलॉग GDPR, SOC 2 टाइप II, और ISO2700 के अनुरूप है। सभी मॉडल क्लाउड प्लेटफार्मों या ऑन-प्रेम पर सबसे अधिक मांग वाले एंटरप्राइज़ अनुप्रयोगों के लिए अनुरोध पर उपलब्ध हैं।

विक्रय से संपर्क करें

मुख्य विशेषताएँ

जीवंत आवाजें

Play के TTS वॉयस मॉडल्स आवाज़ की गुणवत्ता, प्रोसोदी औरintonation में उद्योग में नेतृत्व करते हैं।

कम विलंबता

पहली ऑडियो तक का समय 320ms तक कम, यदि ऑन-प्रेम डिप्लॉयमेंट की आवश्यकता हो तो इससे भी कम।

उपयोग में आसान

वॉयस आईए जनरेशन और कस्टमाइजेशन सभी उपयोग में आसान APIs द्वारा समर्थित हैं।

सटीकता

संवाद को इस प्रकार समायोजित किया गया है कि संक्षेपाक्षरों, संख्यात्मक अनुक्रमों (जैसे, फोन नंबर, क्रेडिट कार्ड नंबर) की सटीक उत्पत्ति सुनिश्चित की जा सके।

बहुभाषी

इंग्लिश, स्पैनिश, अरबी पूरी तरह से समर्थित; 25+ भाषाएँ विकासाधीन हैं।

सुरक्षा

सभी मॉडल GDPR, ISO 27001 और SOC 2 टाइप II के अनुरूप हैं। ऑन-प्रेम भी उपलब्ध है।

क्या आप हमारी टीम से बात करना चाहते हैं?

यदि आपके पास कोई एंटरप्राइज़ उपयोग मामला है, तो हमें सुनकर खुशी होगी।

विक्रय से संपर्क करें

NEW

Edit Speech with AI

डायलॉग: दुनिया का सबसे अभिव्यक्तिशील वॉयस आईए मॉडल

टीमों द्वारा विश्वसनीय

विन्सटन पोटगिएटर, संस्थापक, एक्सिस एंटरटेनमेंट

< 320ms विलंबता

मल्टी-टर्न बातचीत के लिए अनुकूलित

गतिशील स्वरछंद और भावनाएँ

ऑन-प्रेम पर परिनियोज्य