O MultiTalk é uma ferramenta de geração de vídeo de diálogo multijogador de código aberto orientada por áudio, desenvolvida pela MeiGen-AI. Ela gera vídeos interativos para vários participantes com sincronização labial, inserindo vários áudios, imagens de referência e avisos de texto. O projeto oferece suporte à geração de vídeo de personagens reais e de desenho animado para diálogo, canto...
O FantasyTalking é um projeto de código aberto desenvolvido pela equipe do Fantasy-AMAP, com foco na geração de vídeos de retratos falados realistas por meio da geração orientada por áudio. O projeto se baseia no modelo avançado de difusão de vídeo Wan2.1, combinado com o codificador de áudio Wav2Vec e pesos de modelos proprietários, usando técnicas de inteligência artificial para obter alta ...
O ChatAnyone é um projeto inovador desenvolvido pela equipe do HumanAIGC. Ele usa técnicas de inteligência artificial para gerar vídeos digitais de retratos humanos com movimentos da parte superior do corpo a partir de uma única foto e entrada de áudio. O projeto se baseia em um modelo de difusão de movimento hierárquico que gera movimentos de cabeça, gestos e expressões adequados para a apresentação de...
O VirtualWife é um projeto de pessoa digital virtual de código aberto criado pelo desenvolvedor yakami129. Atualmente, ele está em fase de incubação e tem como objetivo criar um personagem virtual com uma "alma" com a qual os usuários possam interagir como um amigo. O projeto é compatível com a transmissão ao vivo do B-station e pode se comunicar com os usuários por meio de voz e texto em chinês....
A Tavus é uma plataforma para desenvolvedores focada em interações entre humanos e IA, fornecendo APIs fáceis de usar que permitem aos desenvolvedores criar agentes de IA com inteligência visual, de fala e emocional. Seu principal produto, a Interface de Vídeo Conversacional (CVI), imita o cérebro humano...
O HeyGem é uma ferramenta de composição de vídeo totalmente off-line projetada para sistemas Windows, desenvolvida pela equipe do GuijiAI (Silicon Intelligence) e de código aberto no GitHub. Ele usa algoritmos avançados de IA para clonar com precisão a aparência e a voz do usuário e gerar avatares realistas, além de oferecer suporte a texto ou voz...
O AI Studios é uma plataforma on-line de geração de vídeo com IA desenvolvida pela DeepBrain AI, projetada para ajudar os usuários a criar rapidamente conteúdo de vídeo de alta qualidade simplesmente inserindo texto. Sem a necessidade de um software complexo ou de habilidades especializadas, os usuários podem usar sua tecnologia de IA para transformar textos, documentos ou links da Web em vídeos com...
O LiteAvatar é uma ferramenta de código aberto desenvolvida pela equipe HumanAIGC (parte do Ali) que se concentra na geração de animações faciais de avatares 2D acionados por áudio em tempo real. Ele é executado a 30 quadros por segundo (fps), dependendo apenas da CPU, e é especialmente adequado para cenários que exigem baixo consumo de energia, como bate-papo por vídeo 2D em tempo real...
A Yuanzhen Digital People é uma plataforma líder de AIGC (Conteúdo Gerado por Inteligência Artificial) dedicada a fornecer aos usuários serviços completos, como transmissão ao vivo de pessoas digitais, produção de vídeos curtos e assistente de IA. A plataforma integra a síntese de algoritmos de IA e grandes modelos no estilo GPT, oferece suporte aos usuários para a criação de modelos exclusivos de perguntas e respostas e fornece serviços de voz em tempo real...
O Digital Man Generation System é um site que oferece um serviço gratuito de geração de pessoas digitais. O site suporta clonagem de som, reprodução de som, modelo de imagem de pessoa digital, clonagem de divisão digital, remoção de marca d'água de vídeo e outras funções, com o objetivo de fornecer aos usuários soluções eficientes e convenientes de geração de pessoa digital. Os usuários podem fazer upload de texto de áudio...
O SadTalker-Video-Lip-Sync é uma ferramenta de síntese labial de vídeo baseada na implementação do SadTalkers. O projeto gera formas labiais por meio da geração orientada por voz e usa o aprimoramento configurável da região facial para melhorar a clareza das formas labiais geradas. O projeto também usa o algoritmo de interpolação de quadros DAIN para complementar o vídeo gerado com ...
O Linly-Talker é um sistema inovador de diálogo humano digital que combina modelos de linguagem ampla (LLMs) com modelos visuais para criar uma nova abordagem para a interação humano-computador. O sistema integra várias tecnologias, como Whisper, Linly, Microsoft Speech Services e Sad...
O Humva é uma ferramenta inovadora de geração de vídeo com IA projetada para criar vídeos de avatares digitais profissionais ou personalizados, oferecendo uma solução fácil de usar. A plataforma utiliza IA generativa e tecnologia avançada de sincronização labial para fornecer porta-vozes de vídeo personalizados gratuitos para conteúdo de mídia social, apresentações de produtos, depoimentos de clientes e muito mais....
O Rapport Cloud é uma plataforma baseada em nuvem voltada para a criação e a implementação de personagens digitais interativos alimentados por inteligência artificial. Desenvolvida pela equipe da Speech Graphics, a plataforma utiliza sua premiada tecnologia de animação facial baseada em áudio, amplamente utilizada no setor de publicação de jogos AAA.
O Metaverse AI (versão de código aberto) é um projeto hospedado no GitHub, desenvolvido pela equipe da libn-net. Ele pode clonar imagens e vozes humanas digitais por meio da tecnologia de IA para gerar vídeos curtos e também suporta dublagem e legendagem. A ferramenta está disponível para Windows, Web, H5 e applets. .....
O Dreamface é uma poderosa ferramenta de IA projetada para ajudar os usuários a criar facilmente vídeos e imagens de alta qualidade. Com operações simples, os usuários podem gerar vídeos de avatar animados personalizados, reparar fotos antigas, remover fundos de fotos e muito mais. O site oferece uma variedade de recursos orientados por IA que tornam os vídeos e as imagens...
A Gan.AI é uma empresa dedicada a fornecer soluções de personalização de vídeo por meio de tecnologia de inteligência artificial. A plataforma permite que os usuários gerem rapidamente conteúdo de vídeo de alta qualidade sem a necessidade de uma câmera ou equipe de filmagem. Os principais produtos da Gan.AI incluem personalização de vídeo, geração e personalização de avatares, narrações e pares de...
Olá a todos, hoje estou compartilhando com vocês uma ferramenta de criação de pessoas digitais! Ela é fácil de usar e suporta processamento em lote. (Pacote de integração no final do artigo para uso próprio) Acredito que aprendemos algo sobre a tecnologia de pessoas digitais. Antes do incêndio, Guo Degang falava inglês, a beleza russa falava chinês etc., e essa é a personificação da tecnologia de pessoas digitais. Pessoas digitais...
O LiveTalking é um sistema humano digital interativo em tempo real de código aberto, dedicado à criação de soluções humanas digitais ao vivo de alta qualidade. O projeto usa o protocolo de código aberto Apache 2.0 e integra várias tecnologias de ponta, incluindo renderização ER-NeRF, processamento de fluxo de áudio e vídeo em tempo real, sincronização labial e assim por diante. O sistema é compatível com a transmissão digital humana em tempo real ...