AIVocalは無料のAI音声処理プラットフォームで、音声合成(TTS)、音声テキスト化(STT)、人声分離、ポッドキャスト生成を提供します。ユーザーは登録なしで使用でき、24の言語と900以上の自然なトーンをサポートしており、ポッドキャスト、オーディオブック、ビデオダビングなどの作成に適しています。
SuperMaker AIは、高品質な動画、音楽、画像、音声コンテンツを素早く作成できる無料のオンラインオーサリングプラットフォームです。ユーザーはログインすることなくコア機能を試すことができ、使い方もシンプルなので、個人のクリエイターや小規模なチームに適しています。このプラットフォームでは、人工知能技術を利用して、テキスト、画像、クリエイティブ...
Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースの音声合成(TTS)モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3Bをベースに構築されており、SoVITSデコーダーと組み合わせることで、高音質の音声合成を実現します。
Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは、1,300万時間を超える音声データを使って事前に訓練されており、革新的な...
Audibit 是一个开源项目,核心功能是将 Hacker News、TechCrunch 等热门科技文章自动转为音频播客,让用户在通勤、健身或忙碌时通过 Web 端或移动端收听资讯。项目使用 Next.js 和 React 开发前端,结合...
Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表达,如笑声。Dia 的核心是 ...
Orpheus-TTS 是一个开源的文本转语音(TTS)系统,基于 Llama-3b 架构开发,目标是生成接近人类自然语音的音频。它由 Canopy AI 团队推出,支持英语、西班牙语、法语、德语、意大利语、葡萄牙语和汉语等多种语言...
ElevenLabs MCPは、GitHubでホストされているElevenLabsの公式オープンソースプロジェクトです。Model Control Protocol (Model Context Protocol, MCP)に基づいたサーバーツールで、AIモデルとElevenLabを接続するために設計されています。
Vapiは開発者向けの音声AIプラットフォームです。Vapiは、リアルタイムの会話、テレフォニー統合、マルチプラットフォーム展開をサポートする完全なツールとインフラを提供します。
MiniMax Audioは、MiniMax社のAI音声生成ツールで、テキストを類似性の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルをベースにしており、最大99%の音声合成類似度、スタジオ級の音質、30以上の言語と幅広い口語をサポートしています。
Text2Voice 是一个开源工具,基于硅基流动 API 提供文本转语音功能,最大的特点是带有简洁的图形用户界面(GUI)。它由开发者 Sheldon Lee 在 GitHub 上创建,让用户可以通过界面轻松把文字变成语音。项目使用 Py...
Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 OpenAI TTS、AWS Polly 和 MiniM...
Paper to Podcast 是一个开源工具,专门把学术研究论文转化为生动有趣的播客。它通过人工智能技术,将 PDF 格式的论文变成三个角色——主持、学习者和专家——之间的对话,让复杂的学术内容变得简单易懂。这个项目由...
MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質の中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは0.45Bのパラメータしかなく、軽量で効率的です。このプロジェクトはGitHubでホストされており、コードと...
PodcastleはAIベースのオンライン・プラットフォームで、高品質なポッドキャストの迅速な作成と編集を支援することに特化している。録音、編集、公開の機能が統合されており、ユーザーは特別な機器や複雑なソフトウェアを必要とせず、すべてブラウザから行うことができる。同プラットフォームはAI技術を活用し、ノイズ軽減...
IndexTTS 是一个开源的文本转语音(TTS)工具,托管在 GitHub 上,由 index-tts 团队开发。它基于 XTTS 和 Tortoise 技术,通过改进模块设计,提供高效且高质量的语音合成。IndexTTS 使用了数万小时...
csm-mlx 是基于苹果公司开发的 MLX 框架,专门为苹果芯片(Apple Silicon)优化了 CSM(Conversation Speech Model)语音对话模型。这个项目让用户可以用简单的方式在苹果设备上运行高效的语音生成和...
Autiobooks 是一款开源工具,旨在帮助用户将 .epub 格式的电子书快速转换为 .m4b 格式的有声书。它采用 Kokoro 提供的优质语音合成技术,生成的音频自然流畅。这款工具由 David Nesbitt 开发,遵循 MIT ...
PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、テキストを自然でリアルな音声に素早く変換することができます。600以上のAI音声を提供し、60以上の言語と多様なアクセントをサポートし、ポッドキャスト制作、教育コンテンツ、マーケティング、プロモーションなど様々なシーンに適しています。ユーザーは入力するだけです...