Text zu Sprache – diese Sprachsynthese-Tools gibt es 

von Matthes Vogel

text zu sprache

Sprachgeneratoren verwenden die sogenannte Text-to-Speech-Technologie (TTS), die den Text mit einer menschenähnlichen Stimme vorliest und als MP3 zum Speichern anbietet. Diese Generatoren werden sowohl als Hilfsmittel für Menschen mit Lernschwierigkeiten wie Legasthenie und ADHS, als auch von Marketingunternehmen und Filmemachern als Voice-over-Komponente ihres Videomaterials eingesetzt. Auch zum Vertonen von Lernvideos eignen sich diese Text zu Sprache-Tools.

Die Sprachsynthese-Generatoren verfügen häufig über Funktionen, die es den Nutzern ermöglichen, die Geschwindigkeit, mit der der Text gelesen wird, zu steuern und den verwendeten Akzent zu ändern. Alle Tools zur Sprachausgabe, die wir Ihnen hier vorstellen, arbeiten als sogenannter Software As A Service (SAAS).  

Die besten AI-Stimmengeneratoren, die wir bisher gefunden haben:

1. Play.ht

Mit Stimmen von Amazon Polly, Google WaveNet, IBM Watson und Microsoft Azure in über 60 Sprachen hat sich play.ht zu einem der Spitzenreiter der TTS-Branche entwickelt. Abonnenten des Dienstes, der ab $14.25 im Monat erhältlich ist, können .wav und .mp3-  Audio-Dateien generieren. Wort für Wort können Sie bei Bedarf die Aussprache, Tonhöhe und Pausen definieren sowie die Geschwindigkeit festlegen.

Demo-Text zu Sprache verwandelt mit play.ht (Stimme: Vicki – Amazon Polly)

Verfügbar sind dort auch die 90 WaveNet-Stimmen von Google, bei der kaum noch ein Unterschied zur menschlichen Sprache festzustellen ist.

Außerdem überzeugt play.tv mit zahlreichen Integrationen. Neben einer API bietet der Dienst ein WordPress-Plugin, eine Browser-Erweiterung, ein JS Code Snippet und Audio-Widgets an.

Die generierten Dateien lassen sich als Podcast hosten, indem ein RSS feed generiert wird, der um die relevanten Informationen wie Copyright, Autor und Beschreibung ergänzt werden.

play.ht
Screenshot von play.ht

2. Spik.ai 

Mit Spik.ai können Benutzer Eingaben in Form von einfachem Text oder Speech Synthesis Markup Language (SSML) machen. Die Benutzer können ohne Anmeldung Audiodateien aus Text mit bis zu 300 Zeichen erzeugen. Diese Grenze wird für registrierte Benutzer auf 1.000 Zeichen erhöht. Die Software verfügt über eine Reihe von Stimmen und Akzenten. Leider lässt sich die Geschwindigkeit des Audios nicht steuern. Außerdem beschränken sich die Sprachen auf Englisch, Spanisch, Französisch, Deutsch, Arabisch und Chinesisch.

Außerdem können Audio-Dateien transkribiert werden.

Demo-Text zu Sprache verwandelt mit Spik.ai

3. Resemble.ai 

Mehr als als eine Million Audioclips pro Monat werden auf der Resemble-Plattform generiert! Dieses Tool bietet 54.705 Stimmen an, mit denen Text in Sprache umgewandelt werden kann. Dabei kommen alle möglichen Zwecke in Frage: Zum Beispiel Werbedialoge, Markenstimmen für Assistenten und IVR-Agenten. Stimmen können dabei auch verängstigt oder wütend klingen. Derzeit nur auf Englisch, aber dennoch interessant: Sie können ihre eigene Stimme klonen. Über ein geführten Dialog müssen Sie dafür einige Sätze vorlesen, aus der Ihre Stimme mit Deepfake AI generiert wird.  

Demo-Text zu Sprache verwandelt mit Resemble.ai

Die Text zu Sprache-Plattform kann kostenlos getestet werden – das günstigste Abo kostet $30 im Monat.

Resemble.ai
Resemble.AI

4. Lovo – Love Your Voice

Lovo bietet eine kostenlose Version für den persönlichen Gebrauch an, mit unbegrenzten Konvertierungen, Wiedergabe und Teilen an. Allerdings ist der Download des Audio auf drei Dateien pro Monat begrenzt und nur für die persönliche Nutzung bestimmt. 

Demo-Text zu Sprache verwandelt mit Lovo

Ab einem Preis von $34.99 im Monat können Sie die Dateien auch für kommerzielle Zwecke verwenden und ihr Hintergrundmusik hinzufügen. 

Lovo - Text zu Sprache

5. WellSaid Labs

Vom menschlichen Original kaum zu unterscheiden, hört sich der Text-To-Speech von WellSaid Labs sehr natürlich an. Das ganze hat allerdings seinen Preis: Ab $49 im Monat ist das günstigste Abo zu haben; damit lassen sich 250 Audio-Dateien erzeugen und 5 Projekte anlegen. Derzeit ist das Text zu Sprache-Tool jedoch nur auf Englisch verfügbar.

WellSaid Labs
Screenshot von WellSaid Labs

Immerhin: Mit dem einwöchigen Testzugang können Neugierige testen, wie sich die insgesamt 37 Voice-Avatare anhören.

Demo-Text zu Sprache verwandelt mit WellSaid Labs

6. Elai.io

Nicht nur Audiodateien lassen sich mit TTS-Programmen erzeugen. Die Technologie ermöglicht auch das Generieren von Videos, bei der der Text von einem Avatar vorgelesen wird. Bei Elai.io können Sie Powerpoint-Präsentationen, PDF-Dateien oder Google Slides hochladen, mit einem Text versehen und daraus ein Video generieren.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

PGRpdiBjbGFzcz0iYXN0LW9lbWJlZC1jb250YWluZXIiIHN0eWxlPSJoZWlnaHQ6IDEwMCU7Ij48aWZyYW1lIHRpdGxlPSJUZXh0IHp1IFNwcmFjaGUgbWl0IGVsYWkuaW8iIHdpZHRoPSIxMjAwIiBoZWlnaHQ9IjY3NSIgc3JjPSJodHRwczovL3d3dy55b3V0dWJlLW5vY29va2llLmNvbS9lbWJlZC96ZGV2STA5QVRMVT9mZWF0dXJlPW9lbWJlZCIgZnJhbWVib3JkZXI9IjAiIGFsbG93PSJhY2NlbGVyb21ldGVyOyBhdXRvcGxheTsgY2xpcGJvYXJkLXdyaXRlOyBlbmNyeXB0ZWQtbWVkaWE7IGd5cm9zY29wZTsgcGljdHVyZS1pbi1waWN0dXJlIiBhbGxvd2Z1bGxzY3JlZW4+PC9pZnJhbWU+PC9kaXY+
Text zu Sprache mit elai.io

In Form von Slides fügen Sie Hintergrundbilder hinzu und ergänzen diese um Elemente wie Formen, Texte und Bilder. Aus Ihrer Slideshow wird dann ein Video generiert. Ideal, wenn Sie Präsentationen vertonen möchten oder ein Marketingvideo in mehreren Sprachen brauchen.

elai.io
Screenshot von elai.io

Fazit der Tools für Text-Zu-Sprache

Mit diesen Tools können Sie den Geld- und Zeitaufwand für die Erstellung von Voiceovers erheblich reduzieren. Die Anwendungsmöglichkeiten sind schier unendlich: Sei es das Vorlesen eines Blog-Beitrags oder das Vertonen eines Videos. Die Sprachsynthese wird dabei immer lebensechter, wobei die Entwicklung in Englisch bereits am weitesten vorangeschritten ist.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht.

Kostenloser Ersttermin

Keiner kauft gerne die Katze im Sack. Lassen Sie uns daher einen Termin für ein kostenloses Vorgespräch vereinbaren. Hier können Sie mir ausführlich Ihre Anforderungen und Wünsche für die Suchmaschinenoptimierung, Re-Design oder Erstellung Ihrer Webseite mitteilen.

Vogel
Scroll to Top