Introdução abrangente O Sim Studio é uma plataforma de código aberto para a criação de fluxos de trabalho de agentes de IA, focada em ajudar os usuários a projetar, testar e implementar rapidamente fluxos de trabalho de modelo de linguagem (LLM) em larga escala por meio de uma interface visual leve e intuitiva. Os usuários podem criar aplicativos multiagentes complexos com o recurso de arrastar e soltar, sem necessidade de programação profunda...
Introdução geral O Mad Professor (Grumpy Professor Reads Papers) é uma ferramenta acadêmica de IA de código aberto desenvolvida para pesquisadores e estudantes para simplificar a leitura e a análise de artigos acadêmicos. Ela integra processamento de PDF, tradução de IA, pesquisa RAG, perguntas e respostas de IA e interação por voz. Os usuários podem importar...
Introdução abrangente O AIstudioProxyAPI é um projeto de código aberto que usa a tecnologia Node.js e Playwright para converter a funcionalidade de diálogo do modelo Gemini da versão web do Google AI Studio em padrão, emulando a API OpenAI ...
Introdução geral O Step1X-Edit é uma estrutura de edição de imagens de código aberto desenvolvida pela equipe de IA da Stepfun e hospedada no GitHub. Ele combina um modelo multimodal de linguagem ampla (Qwen-VL) e um transformador de difusão (DiT) para permitir que os usuários editem imagens com comandos simples de linguagem natural, como alterar fundos, remover objetos ....
Introdução geral A Klavis AI é uma plataforma de código aberto focada em simplificar o uso e a integração do protocolo de contexto de modelo (MCP), um padrão aberto que permite que os aplicativos de IA se conectem dinamicamente a ferramentas e fontes de dados externas.
Introdução geral O RealtimeVoiceChat é um projeto de código aberto voltado para conversas naturais e em tempo real com inteligência artificial por meio de voz. Os usuários usam um microfone para inserir sua voz, o sistema captura o áudio por meio de um navegador, converte-o rapidamente em texto, gera uma resposta a partir de um modelo de linguagem grande (LLM) e, em seguida, converte o texto em fala...
Introdução geral O MiMo é um projeto de modelagem de linguagem grande de código aberto desenvolvido pela Xiaomi, com foco em raciocínio matemático e geração de código. O produto principal é a família de modelos MiMo-7B, que consiste em um modelo básico (Base), um modelo de ajuste fino supervisionado (SFT), um modelo de aprendizado de reforço treinado a partir do modelo básico (RL-Zero) e um modelo de aprendizado de reforço treinado a partir do SFT...
O Synthesis Muyan-TTS é um modelo de conversão de texto em fala (TTS) de código aberto projetado para cenários de podcasting. Ele é pré-treinado com mais de 100.000 horas de dados de áudio de podcast e suporta síntese de fala de amostra zero para gerar fala natural de alta qualidade. O modelo foi desenvolvido com base no Llama-3.2-3B, combinado com a decodificação SoVITS...
Introdução geral O CAD-MCP é um projeto de código aberto que permite aos usuários controlar o software CAD para operações de desenho por meio de comandos de linguagem natural. Ele combina processamento de linguagem natural e tecnologias de automação de CAD para permitir que os usuários criem e modifiquem desenhos sem precisar manipular manualmente a interface de CAD, apenas inserindo comandos de texto simples. Projeto ...
Introdução abrangente O GraphGen é uma estrutura de código aberto desenvolvida pelo OpenScienceLab, um laboratório de IA em Xangai, hospedado no GitHub, com foco na otimização do ajuste fino supervisionado de modelos de linguagem grande (LLMs), orientando a geração de dados sintéticos por meio de gráficos de conhecimento. Ele constrói gráficos de conhecimento de granulação fina a partir do texto de origem, usando...
Descrição geral O ACI.dev é uma plataforma de infraestrutura de código aberto projetada para fornecer às inteligências de IA uma rápida integração com mais de 600 ferramentas. Ela garante que as inteligências tenham acesso seguro a ferramentas como o Google Agenda, o Slack e o Brave Search por meio de autenticação de vários locatários e gerenciamento de permissões refinadas....
Introdução geral O llm.pdf é um projeto de código aberto que permite aos usuários executar modelos de linguagem grandes (LLMs) diretamente em arquivos PDF. Desenvolvido por EvanZhouDev e hospedado no GitHub, esse projeto demonstra uma abordagem inovadora: llama.cpp via Emscripten...
O General Abogen é uma ferramenta de código aberto projetada para converter rapidamente arquivos ePub, PDF ou de texto simples em áudio de alta qualidade. Ele usa o modelo Kokoro-82M para gerar uma fala natural e suave e oferece suporte à geração simultânea de legendas, o que o torna adequado para audiolivros, dublagem de vídeo ou auxílios de aprendizagem. Use...
Introdução geral O Local Deep Research é um assistente de pesquisa de IA de código aberto projetado para ajudar os usuários a realizar pesquisas profundas e gerar relatórios detalhados para problemas complexos. Ele oferece suporte à execução local, permitindo que os usuários concluam tarefas de pesquisa sem depender de serviços em nuvem. A ferramenta combina modelagem local de linguagem grande...
Introdução geral O Trackers é uma biblioteca de ferramentas Python de código aberto voltada para o rastreamento de vários objetos em vídeo. Ela integra vários dos principais algoritmos de rastreamento, como o SORT e o DeepSORT, permitindo que os usuários combinem diferentes modelos de detecção de objetos (por exemplo, YOLO, RT-DETR) para uma análise de vídeo flexível. Os usuários ...
Introdução geral O Kimi-Audio é um modelo de base de áudio de código aberto desenvolvido pela Moonshot AI, com foco na compreensão, geração e diálogo de áudio. Ele oferece suporte a várias tarefas de processamento de áudio, como reconhecimento de fala, P&R de áudio e reconhecimento de emoções na fala. O modelo foi pré-treinado com mais de 13 milhões de horas de dados de áudio,...
Introdução geral O Describe Anything é um projeto de código aberto desenvolvido pela NVIDIA e por várias universidades, com o Describe Anything Model (DAM) em seu núcleo. Essa ferramenta gera uma imagem ou um vídeo detalhado com base nas áreas marcadas pelo usuário na imagem ou no vídeo (como pontos, caixas, rabiscos ou máscaras)...
Introdução O Cooragent é uma estrutura de colaboração de agentes de IA de código aberto desenvolvida pelo LeapLab da Universidade de Tsinghua e hospedada no GitHub. Ele permite que os usuários criem agentes de IA inteligentes com uma descrição de uma frase e oferece suporte a vários agentes para colaborar em tarefas complexas. A estrutura oferece dois modos: Agent Factory (Fábrica de agentes)...
Introdução geral O InstantCharacter é um projeto de código aberto desenvolvido pela Tencent Hunyuan e pela equipe do InstantX, hospedado no GitHub. Ele usa uma imagem de referência e uma descrição de texto para gerar imagens de personagens com aparência consistente para uma variedade de cenas e estilos. O projeto é baseado na var...