Clonagem de voz com IA

 Enviar site

Conch Speech (MiniMax Audio): ferramenta de IA para gerar discurso natural
O MiniMax Audio é uma ferramenta de geração de fala de IA da MiniMax, com o recurso principal de converter rapidamente texto em fala natural altamente semelhante. Ela se baseia no modelo Speech-02, com uma similaridade de síntese de fala de até 99%, qualidade de som de nível de estúdio e suporte para mais de 30 idiomas e uma ampla variedade de...
04-08 1.0 K1Recomendado
MegaTTS3: um modelo leve para sintetizar a fala em chinês e inglês
O MegaTTS3 é uma ferramenta de síntese de fala de código aberto desenvolvida pela ByteDance em colaboração com a Universidade de Zhejiang, com foco na geração de fala em chinês e inglês de alta qualidade. Seu modelo principal tem apenas 0,45B de parâmetros, é leve e eficiente, suporta a geração de fala mista em chinês e inglês e a clonagem de fala. O projeto está hospedado no GitHub, fornecendo código e...
03-29 9120Recomendado
Seed-VC: suporta a conversão em tempo real de fala e música com menos amostras
O Seed-VC é um projeto de código aberto no GitHub, desenvolvido pela Plachtaa. Ele pode usar de 1 a 30 segundos de áudio de referência para realizar rapidamente a conversão de voz ou música, sem treinamento adicional. O projeto oferece suporte à conversão de voz em tempo real com uma latência tão baixa quanto 400 milissegundos ou mais, adequada para reuniões on-line, jogos ...
03-19 7480Recomendado
Clonagem de voz CSM: clonagem rápida de voz com o CSM-1B
O CSM Voice Cloning é um projeto de código aberto desenvolvido por Isaiah Bjork e hospedado no GitHub. Ele se baseia no modelo Sesame CSM-1B, que permite que os usuários clonem sua própria voz e gerem uma voz com suas próprias características pessoais simplesmente fornecendo uma amostra de áudio. Essa ferramenta é compatível com essa...
03-18 7480Recomendado
PlayHT: uma ferramenta de IA para gerar fala hiper-realista
A PlayHT é uma plataforma on-line eficiente que se concentra na geração de fala com IA para ajudar os usuários a converter rapidamente o texto em uma fala natural e realista. Ela oferece mais de 600 vozes de IA, suporta mais de 60 idiomas e diversos sotaques e é adequada para uma variedade de cenários, como produção de podcast, conteúdo educacional, marketing e promoção. Os usuários só precisam inserir...
03-04 8940Recomendado
Spark-TTS: uma ferramenta de conversão de texto em fala para gerar fala natural
O Spark-TTS é uma ferramenta de conversão de texto em fala (TTS) de código aberto desenvolvida pela equipe do SparkAudio, hospedada no GitHub, projetada para ajudar os usuários a converter texto em fala natural e suave com eficiência. Ela se baseia em tecnologia avançada de aprendizagem profunda e oferece suporte a vários idiomas e estilos de voz...
03-03 1.0 K0Recomendado
Step-Audio
O Step-Audio é uma estrutura de interação de voz inteligente de código aberto projetada para fornecer recursos de geração e compreensão de fala prontos para uso em ambientes de produção. A estrutura oferece suporte a diálogos em vários idiomas (por exemplo, chinês, inglês, japonês), fala emocional (por exemplo, feliz, triste), dialetos regionais (por exemplo, cantonês, Sichuan), taxa de fala ajustável...
02-19 1.2 K0Recomendado
Zonos: ferramentas de síntese de fala e clonagem de fala de alta qualidade
O Zonos é uma ferramenta de síntese e clonagem de fala de código aberto desenvolvida pela Zyphra. A versão Zonos-v0.1 emprega um transformador avançado e um modelo de combinação para gerar uma saída de fala de alta qualidade. A ferramenta é compatível com vários idiomas, incluindo inglês, japonês, chinês, francês e alemão, e oferece...
02-12 1.5 K0Recomendado
Weights: uma plataforma de autoria de música cover de imitação de voz e texto para fala
O Weights é uma plataforma social para criatividade usando IA que permite aos usuários criar capas de voz, conversão de texto em fala, imagens, músicas e vídeos com ações simples. A plataforma oferece uma grande variedade de ferramentas e modelos para ajudar os usuários a começar rapidamente e compartilhar seu trabalho com a comunidade.
01-30 1.3 K0Recomendado
AnyVoice: clonagem de voz on-line gratuita em apenas 3 segundos!
O AnyVoice é uma plataforma de geração de fala com IA de última geração que oferece serviços de geração de fala e clonagem de voz ultrarrealistas. A plataforma permite que os usuários convertam texto em fala natural e escolham entre centenas de vozes predefinidas. Se você não conseguir encontrar a voz certa, apenas 3 segundos de gravação podem ser liberados...
01-30 1.4 K0Recomendado
Llasa 1~8B: um modelo de conversão de texto em fala de código aberto para geração e clonagem de fala de alta qualidade
O Llasa-3B é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong (HKUST Audio). O modelo é baseado na arquitetura Llama 3.2B, que foi cuidadosamente ajustada para fornecer geração de fala de alta qualidade que não apenas suporta vários idiomas, mas também permite a expressão emocional e a geração de fala personalizada.
01-27 1.4 K0Recomendado
Agente de pesca
Fish Speech Derivative Project O Fish Agent é um revolucionário sistema de clonagem de fala de IA de ponta a ponta desenvolvido com base na arquitetura do modelo V0.1 3B. Como um sistema de processamento de clonagem de fala de ponta a ponta, sua característica mais importante é que ele adota um projeto inovador de arquitetura sem tags semânticas, que não precisa depender de linguagens tradicionais, como o Whisper .....
01-03 1.6 K0Recomendado
ViiTor AI: serviço de tradução multilíngue de áudio/vídeo, síntese e clonagem de fala
A ViiTor AI é uma poderosa plataforma de inteligência artificial focada em fornecer serviços de tradução de vídeo de alta qualidade, clonagem de voz, vídeos de avatar gerados por IA e síntese de fala. A plataforma é compatível com vários idiomas e foi projetada para ajudar os usuários a criar conteúdo multilíngue com facilidade.
12-26 1.5 K0Recomendado
Voicemod: alterador de voz em tempo real, bate-papo por voz, alteração de voz em jogos
O Voicemod é um dos principais softwares de efeitos sonoros e alterador de voz em tempo real para Windows e macOS. Seja em um jogo de interpretação de papéis, em um bate-papo com amigos ou em uma transmissão ao vivo, o Voicemod oferece uma grande variedade de efeitos de alteração de voz. Com a tecnologia de IA, o Voicemod é capaz de alterar a voz em tempo real...
11-30 1.6 K0Recomendado
Amphion MaskGCT: modelo de clonagem de texto para fala com amostragem zero (pacote de implantação local com um clique)
O MaskGCT (Masked Generative Codec Transformer) é um modelo de conversão de texto em fala (TTS) totalmente não-autoregressivo introduzido em conjunto pela Funky Maru Technology e pela Universidade Chinesa de Hong Kong. O modelo não requer informações explícitas de alinhamento de texto para fala e adota uma abordagem de geração em dois estágios, primeiramente por meio de...
10-29 1.9 K0Recomendado
Fukumaru Chione
O Funmaru Thousand Voices é uma plataforma de síntese de voz de IA multilíngue que oferece soluções de geração de voz realistas e naturais. Os usuários podem converter facilmente o conteúdo de texto em áudio de nível profissional e apoiar a criação de vozes de IA exclusivas (clones de voz) a partir de zero amostras para atender às necessidades personalizadas. A plataforma também oferece a função de tradução de vídeo para ajudar os usuários a...
10-29 1.4 K0Recomendado
CosyVoice: projeto de código aberto de clonagem de voz de 3 segundos lançado por Ali com suporte para tags controladas emocionalmente
O CosyVoice é um modelo multilíngue de geração de fala em larga escala que oferece recursos de pilha completa, desde a inferência, o treinamento até a implantação. Desenvolvido pela equipe do FunAudioLLM, o objetivo é obter uma síntese de fala de alta qualidade por meio de transformadores autorregressivos avançados e modelos de difusão baseados em ODE.
10-24 2.5 K0Recomendado
Gerador de vídeo Conch AI: texto ou imagem para gerar vídeo de alta qualidade, criação de filmagens para filmes e TV
O Conch AI Video Generator é uma ferramenta avançada de geração de vídeo com IA desenvolvida pela MiniMax. Os usuários só precisam fornecer uma descrição de texto simples ou carregar imagens, e o Conch AI pode gerar rapidamente conteúdo de vídeo de alta qualidade. A ferramenta é amplamente usada por criadores, profissionais de marketing e contadores de histórias para ajudá-los a...
10-17 1.7 K0Recomendado
Coqui TTS (xTTS): um kit de ferramentas de aprendizagem profunda para geração de texto para fala com suporte multilíngue e recursos de clonagem de voz
Introdução abrangente O Coqui TTS é um kit de ferramentas de geração de texto para fala (TTS) avançado e de código aberto baseado em técnicas de aprendizagem profunda. Ele foi testado em ambientes de pesquisa e de produção e oferece um rico conjunto de recursos e modelos que suportam a conversão de texto em fala em vários idiomas.
10-17 1.7 K0Recomendado