AI Text-to-Speech

 Website einreichen

AIVocal: ein kostenloses KI-Tool zur Erstellung von Podcasts und zur Audiobearbeitung
AIVocal ist eine kostenlose KI-Audioverarbeitungsplattform, die Text-to-Speech (TTS), Speech-to-Text (STT), menschliche Sprachseparation und Podcast-Erzeugung bietet. Benutzer können es ohne Registrierung verwenden, und es unterstützt 24 Sprachen und mehr als 900 natürliche Töne, die für die Produktion von Podcasts, Hörbüchern, Video-Synchronisation und so weiter geeignet ist....
06-27 1340Gelobt
SuperMaker
SuperMaker AI ist eine kostenlose Online-Authoring-Plattform, mit der Benutzer schnell hochwertige Video-, Musik-, Bild- und Sprachinhalte erstellen können. Die Benutzer können die Kernfunktionen ohne Anmeldung ausprobieren. Die Anwendung ist einfach und eignet sich daher für einzelne Autoren und kleine Teams. Die Plattform nutzt die Technologie der künstlichen Intelligenz zur Erstellung von Texten, Bildern oder...
06-11 2630Gelobt
Muyan-TTS: Personalisiertes Podcast-Sprachtraining und -synthese
Muyan-TTS ist ein Open-Source-Text-to-Speech-Modell (TTS), das für Podcasting-Szenarien entwickelt wurde. Es wurde mit über 100.000 Stunden Podcast-Audiodaten trainiert und unterstützt die Null-Sample-Sprachsynthese, um qualitativ hochwertige natürliche Sprache zu erzeugen. Das Modell basiert auf Llama-3.2-3B, und in Kombination mit dem SoVITS-Decoder bietet es eine hohe...
05-06 9140Gelobt
Kimi-Audio: Open-Source-Audioverarbeitung und Dialogbasis-Modell
Kimi-Audio ist ein Open-Source-Audiobasismodell, das von Moonshot AI entwickelt wurde und sich auf das Verstehen, die Erzeugung und den Dialog von Audio konzentriert. Es unterstützt eine breite Palette von Audio-Verarbeitung Aufgaben wie Spracherkennung, Audio-Q&A, und Sprache Emotion Anerkennung. Das Modell wurde mit über 13 Millionen Stunden Audiodaten vortrainiert, kombiniert mit innovativen...
05-05 5770Gelobt
Audibit: Umwandlung beliebter technischer Artikel in anhörbare Audio-Podcasts
Audibit ist ein Open-Source-Projekt, die Kernfunktion ist es, Hacker News, TechCrunch und andere populäre Technologie-Artikel automatisch in Audio-Podcasts verwandelt, so dass die Nutzer in der pendeln, Fitness, oder beschäftigt, wenn das Hören von Informationen über das Web oder Handy. Das Projekt verwendet Next.js und React, um das Front-End zu entwickeln, kombiniert mit ...
05-05 5250Gelobt
Dia: ein Text-to-Speech-Modell zur Erzeugung hyperrealistischer Multiplayer-Dialoge
Dia ist ein von Nari Labs entwickeltes Open-Source-Text-to-Speech (TTS)-Modell, das sich auf die Erzeugung von hyperrealistischem Dialog-Audio konzentriert. Es wandelt Text-Skripte in einem einzigen Prozess in realistische Dialoge mit mehreren Zeichen um, unterstützt die Steuerung von Emotionen und Intonation und erzeugt sogar nonverbale Ausdrücke wie Lachen...
04-22 6380Gelobt
Orpheus-TTS: Ein Text-to-Speech-Werkzeug zur Erzeugung natürlicher chinesischer Sprache
Orpheus-TTS ist ein quelloffenes Text-to-Speech (TTS)-System, das auf der Llama-3b-Architektur entwickelt wurde, mit dem Ziel, Audio zu erzeugen, das der natürlichen menschlichen Sprache nahe kommt. Es wird vom Canopy AI-Team entwickelt und unterstützt mehrere Sprachen wie Englisch, Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch und Chinesisch...
04-12 6810Gelobt
ElevenLabs MCP: MCP-Dienst der Spracherzeugung
ElevenLabs MCP ist ein offizielles Open-Source-Projekt von ElevenLabs, das auf GitHub gehostet wird. Es ist ein Server-Tool, das auf dem Model Control Protocol (Model Context Protocol, MCP) basiert und entwickelt wurde, um AI-Modelle und ElevenLab zu verbinden...
04-10 6140Gelobt
Vapi: Unterstützung von Entwicklern bei der Entwicklung von Sprachassistenten mit niedriger Latenz
Vapi ist eine Sprach-KI-Plattform für Entwickler. Sie ermöglicht es Nutzern, Sprach-KI-Assistenten in Minutenschnelle zu erstellen, zu testen und einzusetzen und löst damit das traditionelle Problem der zeitaufwändigen Entwicklung von Sprach-Apps und die Schwierigkeiten bei der Skalierung.Vapi bietet vollständige Tools und eine Infrastruktur zur Unterstützung von Echtzeitgesprächen, Telefonie-Integration und plattformübergreifender Bereitstellung....
04-08 6750Gelobt
Conch Speech (MiniMax Audio): KI-Tool zur Erzeugung natürlicher Sprache
MiniMax Audio ist ein KI-Spracherzeugungstool von MiniMax, dessen Hauptfunktion die schnelle Umwandlung von Text in sehr ähnliche natürliche Sprache ist. Es basiert auf dem Modell Speech-02, mit einer Sprachsynthese Ähnlichkeit von bis zu 99%, Studio-Qualität, und Unterstützung für mehr als 30 Sprachen und eine breite Palette von Mund...
04-08 9761Gelobt
Text2Voice: eine grafische Text-zu-Sprache-Schnittstelle auf der Grundlage von Silizium-basierten Flow-APIs
Text2Voice ist ein Open-Source-Tool, das Text-zu-Sprache-Funktionen auf der Grundlage einer siliziumbasierten Mobilitäts-API bietet und sich durch eine übersichtliche grafische Benutzeroberfläche (GUI) auszeichnet. Es wurde vom Entwickler Sheldon Lee auf GitHub erstellt, um Benutzern die einfache Umwandlung von Text in Sprache über eine Schnittstelle zu ermöglichen. Das Projekt verwendet Py...
04-06 6910Gelobt
Operatives Open-Source-Projekt, das mehrere fortschrittliche Sprachsynthesedienste integriert
Open-VoiceCanvas ist eine Open-Source-Plattform für Sprachsynthese, die vom ItusiAI-Team entwickelt wurde. Sie unterstützt mehr als 50 Sprachen, wandelt Text in natürliche Sprache um und ermöglicht es Ihnen, eine personalisierte Stimme zu klonen, indem Sie Audio hochladen. Das Projekt integriert OpenAI TTS, AWS Polly und MiniM...
04-02 7220Gelobt
Paper to Podcast: Umwandlung akademischer Papiere in Podcasts mit Konversation für mehrere Personen
Paper to Podcast ist ein Open-Source-Tool, das sich darauf spezialisiert hat, akademische Forschungsarbeiten in lebendige und unterhaltsame Podcasts zu verwandeln. Es macht komplexe akademische Inhalte leicht verständlich, indem es die Technologie der künstlichen Intelligenz nutzt, um ein PDF-formatiertes Papier in einen Dialog zwischen drei Personen zu verwandeln - dem Moderator, dem Lernenden und dem Experten. Dieses Projekt wurde entwickelt von...
03-31 6900Gelobt
MegaTTS3: Ein leichtgewichtiges Modell zur Synthese von chinesischer und englischer Sprache
MegaTTS3 ist ein Open-Source-Sprachsynthese-Tool, das von ByteDance in Zusammenarbeit mit der Zhejiang University entwickelt wurde und sich auf die Erzeugung hochwertiger chinesischer und englischer Sprache konzentriert. Sein Kernmodell ist nur 0,45B Parameter, leicht und effizient, Unterstützung für gemischte chinesische und englische Sprache Generation und Sprache Klonen. Das Projekt ist auf GitHub gehostet und bietet Code und...
03-29 8870Gelobt
Podcastle: das KI-Tool zur schnellen Erstellung hochwertiger Podcasts
Podcastle ist eine KI-basierte Online-Plattform, die darauf spezialisiert ist, Nutzern bei der schnellen Erstellung und Bearbeitung hochwertiger Podcasts zu helfen. Sie integriert Aufnahme-, Bearbeitungs- und Veröffentlichungsfunktionen, und die Nutzer können dies alles über einen Browser erledigen, ohne dass sie spezielle Geräte oder komplexe Software benötigen. Die Plattform nutzt KI-Technologie, um Lärmschutz zu bieten...
03-29 7830Gelobt
IndexTTS: Text-to-Speech-Tool mit Unterstützung für Chinesisch-Englisch-Mischung
IndexTTS ist ein Open-Source-Tool für Text-to-Speech (TTS), das auf GitHub gehostet und vom index-tts-Team entwickelt wird. Es basiert auf XTTS und Tortoise-Technologien und bietet eine effiziente und qualitativ hochwertige Sprachsynthese durch ein verbessertes Moduldesign.IndexTTS verwendet zehntausende von...
03-27 8480Gelobt
csm-mlx: csm-Sprachgenerierungsmodell für Apple-Geräte
csm-mlx basiert auf dem von Apple entwickelten MLX-Framework, das für das Sprachdialogmodell CSM (Conversation Speech Model) speziell für Apple Silicon optimiert wurde. Dieses Projekt ermöglicht es Benutzern, effiziente Spracherzeugung auf Apple-Geräten auf einfache Art und Weise...
03-18 7010Gelobt
Autiobooks: epub ebooks in m4b-Hörbücher umwandeln
Autiobooks ist ein Open-Source-Tool, das Benutzern helfen soll, eBooks im .epub-Format schnell in Hörbücher im .m4b-Format zu konvertieren. Es verwendet die hochwertige Sprachsynthesetechnologie von Kokoro, um ein natürliches und flüssiges Audio zu erzeugen. Das Tool wurde von David Nesbitt entwickelt und folgt dem MIT ...
03-12 6510Gelobt
PlayHT: ein KI-Tool zur Erzeugung hyperrealistischer Sprache
PlayHT ist eine effiziente Online-Plattform, die sich auf die KI-Sprachgenerierung konzentriert und den Nutzern hilft, Text schnell in natürliche, realistische Sprache umzuwandeln. Es bietet mehr als 600 KI-Stimmen, unterstützt mehr als 60 Sprachen und verschiedene Akzente und eignet sich für eine Vielzahl von Szenarien wie Podcast-Produktion, Bildungsinhalte, Marketing und Werbung. Die Benutzer müssen nur die...
03-04 8780Gelobt