O SuperMaker AI é uma plataforma de criação on-line gratuita que ajuda os usuários a gerar rapidamente conteúdo de vídeo, música, imagem e voz de alta qualidade. Os usuários podem experimentar os principais recursos sem fazer login, e é fácil de usar, o que a torna adequada para criadores individuais e pequenas equipes. A plataforma usa tecnologia de inteligência artificial para criar textos, imagens ou...
O SkyReels-V2 é um modelo de geração de vídeo de código aberto desenvolvido pela SkyworkAI. Ele suporta a geração de vídeos de duração ilimitada para tarefas de texto para vídeo (T2V) e imagem para vídeo (I2V) por meio de técnicas avançadas de forçamento de difusão. Os usuários podem usar descrições de texto ou...
O FramePack é uma ferramenta de geração de vídeo de código aberto que tem como objetivo tornar as técnicas de difusão de vídeo mais práticas. Ele desacopla a carga de trabalho de geração da duração do vídeo, compactando os quadros de entrada em um comprimento fixo por meio de uma rede neural exclusiva de previsão do próximo quadro. Isso significa que, mesmo ao gerar vídeos longos, os requisitos de memória de vídeo não aumentam significativamente.
O Open-Sora é um projeto de código aberto desenvolvido para permitir que qualquer pessoa gere vídeos de alta qualidade com eficiência. Ele foi desenvolvido pela equipe hpcaitech para fornecer ferramentas para gerar vídeo a partir de texto ou imagens, com suporte a várias resoluções e durações. O projeto é totalmente de código aberto, expondo os pesos do modelo, o código e o processo de treinamento, e incentivando a comunidade a contribuir...
O Pollo AI é uma plataforma completa de IA que integra uma variedade de modelos líderes de IA, como Kling AI, Stable Diffusion e Flux, para permitir que os usuários gerem rapidamente vídeos e imagens de alta qualidade a partir de texto, fotos ou vídeos. Quer se trate de um estilo realista, efeito de anime ou criação artística, os usuários simplesmente...
O OpenCreator é uma ferramenta on-line projetada para criadores com a função principal de reunir mais de 20 modelos generativos de IA. Os usuários podem usá-la para gerar facilmente vídeos criativos sem alternar entre plataformas ou pagar várias assinaturas. Ele tem uma interface simples e suporta a comparação com um clique de diferentes efeitos de modelo...
O Twin AI é uma ferramenta simples e útil que ajuda os usuários a transformar rapidamente fotos ou vídeos em vídeos personalizados com IA. Ela foi desenvolvida pela Alias Technologies e é adequada para criadores de conteúdo, usuários corporativos ou qualquer pessoa que queira experimentar a produção de vídeos com IA. Os usuários podem carregar fotos para gerar vídeos criativos ou carregar...
O StoryDiffusion é uma ferramenta de IA on-line especializada na transformação de histórias escritas em imagens e vídeos visuais. Usando técnicas avançadas de modelagem de difusão, ela gera sequências de imagens consistentes ou vídeos animados com base no texto inserido pelo usuário, perfeito para criar histórias em quadrinhos, vídeos curtos ou apresentações criativas. Os principais recursos do site...
O ComfyUI-WanVideoWrapper é um plug-in de código aberto criado pelo desenvolvedor kijai e projetado para a plataforma ComfyUI. Ele é baseado no modelo Wan2.1 da WanVideo e oferece recursos avançados de geração e processamento de vídeo. Os usuários podem usá-lo para obter imagens para vídeo (I2...
O SkyReels-V1 é um projeto de código aberto desenvolvido pela equipe da SkyworkAI, focado na geração de conteúdo de vídeo de alta qualidade e centrado no ser humano. O projeto se baseia no modelo HunyuanVideo, que é o primeiro modelo básico de vídeo de ação humana do mundo, criado pelo ajuste fino de dezenas de milhões de clipes de TV e filmes de alta qualidade. Ele não...
O DragAnything é um projeto de código-fonte aberto que visa a obter o controle de movimento de objetos arbitrários por meio da representação de entidades. O projeto é desenvolvido pela equipe do Showlab e foi aceito pelo ECCV 2024. O DragAnything oferece uma interação amigável em que o usuário simplesmente desenha uma linha de trajetória para controlar um par de...
Introdução geral O HunyuanVideoGP é um modelo de geração de vídeo em larga escala desenvolvido pela DeepBeepMeep e projetado para usuários de GPUs de baixo custo. O modelo é uma versão aprimorada do modelo original do Hunyuan Video, com requisitos de memória e memória de vídeo significativamente reduzidos, permitindo que ele seja usado em GPUs de 12 GB a 24 GB...
A Luma Labs é uma empresa focada na geração de imagens e vídeos de alta qualidade usando tecnologia de inteligência artificial. Seus principais produtos incluem o Luma Photon e o Luma Ray2, ferramentas que geram imagens e vídeos fotorrealistas a partir de texto para uma variedade de usos criativos e comerciais.
O Goku é um modelo federado de geração de imagem e vídeo baseado em técnicas de transformação de fluxo projetadas para obter desempenho de nível industrial. Ele integra técnicas avançadas de geração visual de alta qualidade, incluindo agrupamento de dados de granularidade fina, design de modelo e formulação de transformação de fluxo.
O X-Dyna é um projeto de código aberto desenvolvido pela ByteDance para gerar animações dinâmicas de retratos por meio de técnicas de difusão de amostra zero. O projeto usa expressões faciais e movimentos corporais no vídeo de condução para animar imagens de retratos individuais, gerando efeitos dinâmicos realistas e sensíveis ao contexto.
O MOFA-Video é uma ferramenta de geração de animação de imagem de última geração que usa técnicas de adaptação de campo de movimento generativo para converter imagens estáticas em vídeos dinâmicos. O projeto foi desenvolvido em colaboração com a Universidade de Tóquio e o Tencent AI Lab e será apresentado na Conferência Europeia sobre Visão Computacional (ECCV) 2024.
A HiDream.ai é uma startup de inteligência artificial generativa que se concentra na criação de aplicativos e do modelo de base multimodal visual líder mundial. O "HiDream.ai", desenvolvido pela própria empresa, é o primeiro modelo arquitetônico Diffusion Transformer (DiT) do mundo para geração de imagens e vídeos, que está disponível on-line em ......
O LTX-Video é o primeiro modelo de geração de vídeo em tempo real baseado no DiT (Diffusion Transformer) desenvolvido pela Lightricks. O modelo é capaz de gerar vídeo de alta qualidade a 24 quadros por segundo com resolução de 768×512, mais rápido do que o tempo necessário para assistir ao vídeo.
O DisPose é um projeto inovador de inteligência artificial de código aberto voltado para a geração controlada de animação de imagens de personagens. Desenvolvido por uma equipe de pesquisadores e com código aberto no GitHub, o projeto usa técnicas avançadas de aprendizagem profunda para obter um controle preciso da animação de personagens por meio da decomposição das informações de pose do esqueleto.