NEW

Change Your Voice with AI

Dialog: Das ausdrucksstärkste Sprach-KI-Modell der Welt

Dialog is a highly expressive, natural sounding voice AI model ideal for narrations, audiobooks, podcasts, and voice agents, where accurate and engaging conversational tone, prosody and emotion are required.

Vertraut von Teams bei

NextKast hat einen vollautomatischen KI-DJ für unsere Radiosenderkunden entwickelt, der die Stimmen von PlayAI Dialog verwendet. Wir lieben es, wie ausdrucksstark, emotional und natürlich die Stimmen klingen, und haben auf dem Markt nichts anderes gefunden, das dem nahe kommt. Beim Radio geht es vor allem darum, die Zuhörer bei der Stange zu halten, und das schaffen die Stimmen von Play .

Winston Potgieter, Gründer, Axis Entertainment

< 320ms Latenzzeit

Optimiert für Multi-Turn-Gespräche

Dynamische Prosodie und Emotion

Vor Ort bereitstellbar

Hören Sie den Dialog in Aktion

Erstellen Sie fesselnde und emotionale KI-Erzählungen, Podcasts und Hörbücher oder steuern Sie ultrarealistische Sprachagenten. Dialog versteht jede Wendung in einem Gespräch und erzeugt Sprache mit der richtigen Prosodie, dem richtigen Tempo und der richtigen Emotion.

voice

AI-Podcast zwischen Gastgebern

Generieren Sie komplette AI-Podcasts mit beliebigen Stimmen

Get Started
voice

Gespräch zwischen Personen

Fesselnde kontextbezogene Gespräche zwischen mehreren Charakteren erstellen

Get Started
voice

Fesselnde Erzählung

Erzeugen Sie reichhaltige dramatische erzählerische Inhalte

Get Started
voice

Dramatische Dialoge für eine Szene

Prompt und direkt zu dramatischen Lieferungen führen

Get Started

Der Dialog nutzt den gesamten Kontext einer Konversation

Im Gegensatz zu früheren Sprach-KI-Modellen verwendet PlayDialog den gesamten Gesprächskontext als Eingabe, was bedeutet, dass Erzählungen und Gespräche mit mehreren Gesprächspartnern flüssig, einnehmend und natürlich klingen, mit ausgezeichneter Prosodie, Tempo und Intonation.

Benchmark zum Klonen von Stimmen

Dialog liefert das beste Voice Cloning seiner Klasse

Unsere branchenführenden Funktionen zum Klonen von Stimmen bedeuten, dass Sie mit PlayDialog eine originalgetreue Wiedergabe erhalten, die kaum vom Original zu unterscheiden ist. Erstellen Sie Erzählungen, Podcasts und Nachvertonungen jedes Mal akkurat.

Dialog wird 3:1 gegenüber dem branchenführenden Modell bevorzugt

Dialog wurde in Tests im Verhältnis 3:1 gegenüber dem bekanntesten Modell der Branche bevorzugt und gewann in Sachen Emotion, Qualität und Genauigkeit. Probieren Sie es aus und erleben Sie den Unterschied

PlayAI Dialog vs. Konkurrenzmodell
Generate spoken audio from input text

  import axios from 'axios';
  import dotenv from 'dotenv';
  
  dotenv.config();
  
  // Set up headers with your API secret key and user ID
  const userId = process.env.PLAYDIALOG_USER_ID;
  const secretKey = process.env.PLAYDIALOG_SECRET_KEY;
  
  const headers = {
    'X-USER-ID': userId,
    Authorization: secretKey,
    'Content-Type': 'application/json',
  };
  
  // Define the model
  const model = 'PlayDialog';
  
  // Define voices for the 2 hosts
  // Find all voices here https://docs.play.ai/tts-api-reference/voices
  const voice1 = 's3://voice-cloning-zero-shot/baf1ef41-36b6-428c-9bdf-50ba54682bd8/original/manifest.json';
  const voice2 = 's3://voice-cloning-zero-shot/e040bd1b-f190-4bdb-83f0-75ef85b18f84/original/manifest.json';
  
  // Podcast transcript should be in the format of Host 1: ... Host 2:
  const transcript = `
  Host 1: Welcome to The Tech Tomorrow Podcast! Today we're diving into the fascinating world of voice AI and what the future holds.
  Host 2: And what a topic this is. The technology has come so far from those early days of basic voice commands.
  Host 1: Remember when we thought it was revolutionary just to ask our phones to set a timer?
  Host 2: Now we're having full conversations with AI that can understand context, emotion, and even cultural nuances. It's incredible.
  Host 1: Though it does raise some interesting questions about privacy and ethics. Where do we draw the line?
  Host 2: Exactly. The potential benefits for accessibility and education are huge, but we need to be thoughtful about implementation.
  Host 1: Well, we'll be exploring all of these aspects today. Stay with us as we break down the future of voice AI.
  `;
  
  const payload = {
    model,
    text: transcript,
    voice: voice1,
    voice2: voice2,
    turnPrefix: 'Host 1:',
    turnPrefix2: 'Host 2:',
    outputFormat: 'mp3',
  };
  
  // Send the POST request to trigger podcast generation
  const response = await axios.post('https://api.play.ai/api/v1/tts/', payload, { headers });
  
  // Get the job ID to check the status
  const jobId = response.data.id;
  
  if (!jobId) {
    throw new Error('Job ID not returned by API');
  }
  
  // Use the job ID to check completion status
  const url = `https://api.play.ai/api/v1/tts/${jobId}`;
  const delaySeconds = 2000;
  
  // Keep checking until status is COMPLETED.
  // Longer transcripts take more time to complete.
  let podcastAudio = null;
  while (!podcastAudio) {
    const statusResponse = await axios.get(url, { headers });
    const status = statusResponse.data.output?.status;
    console.log(status);
  
    if (status === 'COMPLETED') {
      // Once completed, audio URL will be available
      podcastAudio = statusResponse.data.output.url;
    } else {
      await new Promise((resolve) => setTimeout(resolve, delaySeconds));
    }
  }
  
  console.log('Podcast audio URL:', podcastAudio);
  
  

Es ist einfach zu programmieren

PlayDialog ist einfach zu bedienen und steht über unsere API und auf Plattformen wie Fal zur Verfügung. Er unterstützt auch Websockets und Streaming von LLMs.

Benötigen Sie es in der Premiere? Kein Problem

Die Modelle von PlayAI können dort eingesetzt werden, wo Sie sie benötigen, einschließlich On-Premise für Anwendungen mit höchster Sicherheit

OnPrem
Unternehmenszertifizierungen

Dialog ist unternehmenstauglich

Dialog ist GDPR-, SOC 2 Typ II- und ISO2700-konform. Alle Modelle sind auf Anfrage auf Cloud-Plattformen oder On-Prem für die anspruchsvollsten Unternehmensanwendungen verfügbar

Wesentliche Merkmale

Lebensechte Stimmen

Die TTS-Sprachmodelle von Play sind in Bezug auf Sprachqualität, Prosodie und Intonation branchenführend.

Geringe Latenzzeit

Die Zeit bis zum ersten Ton beträgt nur 320 ms, bei On-Premise-Bereitstellung weniger

Einfach zu bedienen

Sprach-KI-Erzeugung und -Anpassung, unterstützt durch einfach zu verwendende APIs.

Genauigkeit

Der Dialog ist so abgestimmt, dass Akronyme und Zahlenfolgen (z. B. Telefon- und Kreditkartennummern) korrekt generiert werden können.

Mehrsprachig

Englisch, Spanisch und Arabisch werden vollständig unterstützt; 25+ Sprachen in Entwicklung

Sicherheit

Alle Modelle sind GDPR-, ISO 27001- und SOC 2 Typ II-konform. Auch als On-Premise-Version verfügbar.

Möchten Sie mit unserem Team sprechen?

Wenn Sie einen Anwendungsfall für Ihr Unternehmen haben, würden wir uns freuen, von Ihnen zu hören.