小镜故事板
小镜故事板(xjstoryboard.com)是一个专注于在线创建分镜头脚本的工具。它帮助用户快速制作故事板,适合影视制作、广告策划和动画设计。用户无需专业绘图技能,通过拖拽模板和元素即可完成脚本设计。网站提供多...
MagicArena
MagicArena 是一个专注于视觉生成模型对战的在线平台。用户可以选择不同 AI 模型,输入相同的文字描述,让模型生成内容进行对比和评测。平台适合开发者、研究人员和对 AI 技术感兴趣的人。MagicArena 提供简单操...
SuperMaker
SuperMaker AI 是一个免费的在线创作平台,帮助用户快速生成高质量视频、音乐、图像和语音内容。用户无需登录即可试用核心功能,操作简单,适合个人创作者和小型团队。平台通过人工智能技术,将文字、图片或创意...
Quarkdown:基于Markdown的动态排版工具
Quarkdown 是一个基于 Markdown 的现代化排版工具,扩展了 CommonMark 和 GitHub Flavored Markdown(GFM)的功能。它通过引入函数、变量和标准库,让用户能创建动态内容,轻松生成交互式演示文...
Simple Subtitling: uma ferramenta de código aberto para gerar automaticamente legendas de vídeo e identificação de locutor
O Simple Subtitling é uma ferramenta de código aberto de geração de legendas de áudio que se concentra na geração automática de legendas e na identificação de alto-falantes para arquivos de vídeo ou áudio. O projeto desenvolvido por Jaesung Huh, hospedado no GitHub, tem como objetivo fornecer uma solução simples e eficiente de geração de legendas. Ferramentas por meio da tecnologia de processamento de áudio .....
ArXiv Paper Summarizer: uma ferramenta para resumo automático de artigos do arXiv
O arXiv Summarizer é uma ferramenta de script Python de código aberto, hospedada no GitHub, criada para ajudar os usuários a acessar e gerar rapidamente resumos de artigos acadêmicos da plataforma arXiv. Ele usa a API Gemini gratuita para resumir textos de forma eficiente e é adequado para pesquisadores, estudantes e acadêmicos...
Sim Studio: criador de fluxo de trabalho de código aberto para agentes de IA
O Sim Studio é uma plataforma de código aberto para a criação de fluxos de trabalho de agentes de IA, focada em ajudar os usuários a projetar, testar e implementar rapidamente fluxos de trabalho de modelos de linguagem (LLM) em grande escala por meio de uma interface visual leve e intuitiva. Os usuários podem criar aplicativos multiagentes complexos com o recurso de arrastar e soltar, sem necessidade de programação profunda. Ele suporta essa ...
Hula: transforme selfies em vídeos virais curtos e adesivos personalizados em um clique
O Hula é uma ferramenta criativa com tecnologia de IA projetada para transformar selfies de usuários em vídeos virais, imagens de vários estilos e pacotes de adesivos personalizados com uma simples operação de um clique. A desenvolvedora Prequel Inc. criou o aplicativo para suportar as plataformas iOS e Android para os ávidos usuários de redes sociais...
AIstudioProxyAPI: uso ilimitado das APIs do modelo Gemini 2.5 Pro
AIstudioProxyAPI é um projeto de código aberto que usa a tecnologia Node.js e Playwright para converter a funcionalidade de diálogo do modelo Gemini da versão web do Google AI Studio em uma conexão de API padrão, emulando a API OpenAI ...
Step1X-Edit: uma ferramenta de código aberto para editar imagens com instruções em linguagem natural
O Step1X-Edit é uma estrutura de edição de imagens de código aberto desenvolvida pela equipe de IA da Stepfun e hospedada no GitHub. Ele combina um modelo multimodal de linguagem ampla (Qwen-VL) e um transformador de difusão (DiT) para permitir que os usuários editem uma imagem com comandos simples de linguagem natural, como alterar o plano de fundo, remover um objeto ou transformar o vento ....
Klavis AI: ferramenta de integração do protocolo de contexto de modelo (MCP) para aplicativos de IA
O Klavis AI é uma plataforma de código aberto focada em simplificar o uso e a integração do protocolo de contexto de modelo (MCP), um padrão aberto que permite que os aplicativos de IA se conectem dinamicamente a ferramentas e fontes de dados externas.
MiMo: um pequeno modelo de código aberto para raciocínio matemático eficiente e geração de código
O MiMo é um projeto de modelagem de linguagem grande de código aberto desenvolvido pela Xiaomi, com foco em raciocínio matemático e geração de código. O produto principal é a família de modelos MiMo-7B, que consiste em um modelo de base (Base), um modelo de ajuste fino supervisionado (SFT), um modelo de aprendizado de reforço treinado a partir do modelo de base (RL-Zero) e um modelo SFT treinado a partir de...
Muyan-TTS: treinamento e síntese de fala em podcasts personalizados
O Muyan-TTS é um modelo de conversão de texto em fala (TTS) de código aberto projetado para cenários de podcasting. Ele é pré-treinado com mais de 100.000 horas de dados de áudio de podcast e oferece suporte à síntese de fala de amostra zero para gerar fala natural de alta qualidade. O modelo foi desenvolvido com base no Llama-3.2-3B e, combinado com o decodificador SoVITS, fornece...
CAD-MCP: serviços MCP para controle de software CAD por meio de comandos de linguagem natural
O CAD-MCP é um projeto de código aberto que permite aos usuários controlar as operações de desenho do software CAD por meio de comandos de linguagem natural. Ele combina processamento de linguagem natural e tecnologia de automação de CAD, de modo que os usuários não precisam operar manualmente a interface de CAD, basta inserir comandos de texto simples para criar e modificar o desenho. O projeto oferece suporte a uma variedade de ...
Cotrans
manga-image-translator(Cotrans翻译器开源版),用于翻译漫画或图片中的文字。提供命令行交互方式和在线演示,拥有批量转换模式、web服务器模式等多样化的使用选项。可设置多种语言目标翻译和识别参数,配有详...
GraphGen: ajuste fino de modelos de linguagem usando gráficos de conhecimento para gerar dados sintéticos
O GraphGen é uma estrutura de código aberto desenvolvida pelo OpenScienceLab, um laboratório de IA em Xangai, hospedado no GitHub, focado na otimização do ajuste fino supervisionado de LLMs (Large Language Models), orientando a geração de dados sintéticos por meio de gráficos de conhecimento. Ele constrói gráficos de conhecimento de granulação fina a partir do texto de origem, usando o erro de calibração esperado...
ACI.DEV: Integração de mais de 600 ferramentas para inteligências de IA por meio do servidor MCP
O ACI.dev é uma plataforma de infraestrutura de código aberto projetada para fornecer às inteligências de IA uma rápida integração com mais de 600 ferramentas. Ela garante que as inteligências tenham acesso seguro a ferramentas como o Google Agenda, o Slack e o Brave Search por meio de autenticação multilocatário e gerenciamento de permissões refinadas.
llm.pdf: projeto experimental para executar um modelo de linguagem em grande escala em um arquivo PDF
O llm.pdf é um projeto de código aberto que permite aos usuários executar modelos de linguagem grandes (LLMs) diretamente em arquivos PDF. Desenvolvido por EvanZhouDev e hospedado no GitHub, esse projeto demonstra uma abordagem inovadora: compilar llama.cpp via Emscripten como ...
Abogen: uma ferramenta para converter vários formatos de texto em audiolivros
O Abogen é uma ferramenta de código aberto projetada para converter rapidamente arquivos ePub, PDF ou de texto simples em áudio de alta qualidade. Ele usa o modelo Kokoro-82M para gerar uma fala natural e suave e oferece suporte à geração simultânea de legendas, o que o torna adequado para audiolivros, dublagem de vídeo ou auxílios de aprendizagem. Os usuários podem escolher...