Introdução abrangente O Sim Studio é uma plataforma de código aberto para a criação de fluxos de trabalho de agentes de IA, focada em ajudar os usuários a projetar, testar e implementar rapidamente fluxos de trabalho de modelo de linguagem (LLM) em larga escala por meio de uma interface visual leve e intuitiva. Os usuários podem criar aplicativos multiagentes complexos com o recurso de arrastar e soltar, sem necessidade de programação profunda...
Introdução geral O Mad Professor (Grumpy Professor Reads Papers) é uma ferramenta acadêmica de IA de código aberto desenvolvida para pesquisadores e estudantes para simplificar a leitura e a análise de artigos acadêmicos. Ela integra processamento de PDF, tradução de IA, pesquisa RAG, perguntas e respostas de IA e interação por voz. Os usuários podem importar...
Descrição geral O Hula é uma ferramenta criativa com tecnologia de IA projetada para transformar selfies de usuários em vídeos virais, imagens de vários estilos e pacotes de adesivos personalizados com uma simples operação de um clique. O desenvolvedor Prequel Inc. criou o aplicativo para suportar as plataformas iOS e Android para...
Introdução geral O LoveyDovey é um aplicativo de bate-papo com tecnologia de IA que se concentra em oferecer aos usuários uma experiência interativa em tempo real com personagens virtuais. Os usuários podem criar seus próprios personagens ou selecionar os existentes para iniciar conversas românticas, de amizade ou de outros tipos. O aplicativo faz isso por meio de configurações de personagens altamente personalizáveis e uma variedade de...
Introdução abrangente O AIstudioProxyAPI é um projeto de código aberto que usa a tecnologia Node.js e Playwright para converter a funcionalidade de diálogo do modelo Gemini da versão web do Google AI Studio em padrão, emulando a API OpenAI ...
Introdução geral O Step1X-Edit é uma estrutura de edição de imagens de código aberto desenvolvida pela equipe de IA da Stepfun e hospedada no GitHub. Ele combina um modelo multimodal de linguagem ampla (Qwen-VL) e um transformador de difusão (DiT) para permitir que os usuários editem imagens com comandos simples de linguagem natural, como alterar fundos, remover objetos ....
Introdução geral A Klavis AI é uma plataforma de código aberto focada em simplificar o uso e a integração do protocolo de contexto de modelo (MCP), um padrão aberto que permite que os aplicativos de IA se conectem dinamicamente a ferramentas e fontes de dados externas.
Introdução geral O RealtimeVoiceChat é um projeto de código aberto voltado para conversas naturais e em tempo real com inteligência artificial por meio de voz. Os usuários usam um microfone para inserir sua voz, o sistema captura o áudio por meio de um navegador, converte-o rapidamente em texto, gera uma resposta a partir de um modelo de linguagem grande (LLM) e, em seguida, converte o texto em fala...
Introdução geral O MiMo é um projeto de modelagem de linguagem grande de código aberto desenvolvido pela Xiaomi, com foco em raciocínio matemático e geração de código. O produto principal é a família de modelos MiMo-7B, que consiste em um modelo básico (Base), um modelo de ajuste fino supervisionado (SFT), um modelo de aprendizado de reforço treinado a partir do modelo básico (RL-Zero) e um modelo de aprendizado de reforço treinado a partir do SFT...
O Synthesis Muyan-TTS é um modelo de conversão de texto em fala (TTS) de código aberto projetado para cenários de podcasting. Ele é pré-treinado com mais de 100.000 horas de dados de áudio de podcast e suporta síntese de fala de amostra zero para gerar fala natural de alta qualidade. O modelo foi desenvolvido com base no Llama-3.2-3B, combinado com a decodificação SoVITS...
Introdução geral O CAD-MCP é um projeto de código aberto que permite aos usuários controlar o software CAD para operações de desenho por meio de comandos de linguagem natural. Ele combina processamento de linguagem natural e tecnologias de automação de CAD para permitir que os usuários criem e modifiquem desenhos sem precisar manipular manualmente a interface de CAD, apenas inserindo comandos de texto simples. Projeto ...
Introdução abrangente ao tradutor de mangá-imagem (versão de código aberto do Cotrans Translator) para traduzir mangás ou imagens no texto. Oferece interação de linha de comando e demonstração on-line, com modo de conversão em lote, modo de servidor da Web e outras diversas opções de uso. Pode ser configurado em vários idiomas para tradução de destino e .....
Introdução abrangente O GraphGen é uma estrutura de código aberto desenvolvida pelo OpenScienceLab, um laboratório de IA em Xangai, hospedado no GitHub, com foco na otimização do ajuste fino supervisionado de modelos de linguagem grande (LLMs), orientando a geração de dados sintéticos por meio de gráficos de conhecimento. Ele constrói gráficos de conhecimento de granulação fina a partir do texto de origem, usando...
Descrição geral O ACI.dev é uma plataforma de infraestrutura de código aberto projetada para fornecer às inteligências de IA uma rápida integração com mais de 600 ferramentas. Ela garante que as inteligências tenham acesso seguro a ferramentas como o Google Agenda, o Slack e o Brave Search por meio de autenticação de vários locatários e gerenciamento de permissões refinadas....
Introdução geral O llm.pdf é um projeto de código aberto que permite aos usuários executar modelos de linguagem grandes (LLMs) diretamente em arquivos PDF. Desenvolvido por EvanZhouDev e hospedado no GitHub, esse projeto demonstra uma abordagem inovadora: llama.cpp via Emscripten...
O General Abogen é uma ferramenta de código aberto projetada para converter rapidamente arquivos ePub, PDF ou de texto simples em áudio de alta qualidade. Ele usa o modelo Kokoro-82M para gerar uma fala natural e suave e oferece suporte à geração simultânea de legendas, o que o torna adequado para audiolivros, dublagem de vídeo ou auxílios de aprendizagem. Use...
Introdução geral O Local Deep Research é um assistente de pesquisa de IA de código aberto projetado para ajudar os usuários a realizar pesquisas profundas e gerar relatórios detalhados para problemas complexos. Ele oferece suporte à execução local, permitindo que os usuários concluam tarefas de pesquisa sem depender de serviços em nuvem. A ferramenta combina modelagem local de linguagem grande...
Introdução geral O DeepWiki é uma ferramenta gratuita da Cognition AI voltada para a geração de documentação estruturada, semelhante à da Wikipédia, para repositórios do GitHub. Ele analisa código, arquivos README e arquivos de configuração para criar automaticamente documentação detalhada e diagramas interativos que ajudam os desenvolvedores a entender rapidamente .....
Introdução geral O Trackers é uma biblioteca de ferramentas Python de código aberto voltada para o rastreamento de vários objetos em vídeo. Ela integra vários dos principais algoritmos de rastreamento, como o SORT e o DeepSORT, permitindo que os usuários combinem diferentes modelos de detecção de objetos (por exemplo, YOLO, RT-DETR) para uma análise de vídeo flexível. Os usuários ...