URL alternativo: www.kdjingpai.com

Ctrl + D Marcar este site como favorito

registros

 Enviar site

Muyan-TTS: treinamento e síntese de fala em podcasts personalizados
O Synthesis Muyan-TTS é um modelo de conversão de texto em fala (TTS) de código aberto projetado para cenários de podcasting. Ele é pré-treinado com mais de 100.000 horas de dados de áudio de podcast e suporta síntese de fala de amostra zero para gerar fala natural de alta qualidade. O modelo foi desenvolvido com base no Llama-3.2-3B, combinado com a decodificação SoVITS...
05-06 1840Recomendado
CAD-MCP: serviços MCP para controle de software CAD por meio de comandos de linguagem natural
Introdução geral O CAD-MCP é um projeto de código aberto que permite aos usuários controlar o software CAD para operações de desenho por meio de comandos de linguagem natural. Ele combina processamento de linguagem natural e tecnologias de automação de CAD para permitir que os usuários criem e modifiquem desenhos sem precisar manipular manualmente a interface de CAD, apenas inserindo comandos de texto simples. Projeto ...
05-06 1730Recomendado
Cotrans: tradutor completo de imagens de mangá (código aberto e gratuito)
Introdução abrangente ao tradutor de mangá-imagem (versão de código aberto do Cotrans Translator) para traduzir mangás ou imagens no texto. Oferece interação de linha de comando e demonstração on-line, com modo de conversão em lote, modo de servidor da Web e outras diversas opções de uso. Pode ser configurado em vários idiomas para tradução de destino e .....
05-06 1.6 K0Recomendado
GraphGen: ajuste fino de modelos de linguagem usando gráficos de conhecimento para gerar dados sintéticos
Introdução abrangente O GraphGen é uma estrutura de código aberto desenvolvida pelo OpenScienceLab, um laboratório de IA em Xangai, hospedado no GitHub, com foco na otimização do ajuste fino supervisionado de modelos de linguagem grande (LLMs), orientando a geração de dados sintéticos por meio de gráficos de conhecimento. Ele constrói gráficos de conhecimento de granulação fina a partir do texto de origem, usando...
05-05 960Recomendado
ACI.DEV: Integração de mais de 600 ferramentas para inteligências de IA por meio do servidor MCP
Descrição geral O ACI.dev é uma plataforma de infraestrutura de código aberto projetada para fornecer às inteligências de IA uma rápida integração com mais de 600 ferramentas. Ela garante que as inteligências tenham acesso seguro a ferramentas como o Google Agenda, o Slack e o Brave Search por meio de autenticação de vários locatários e gerenciamento de permissões refinadas....
05-05 860Recomendado
llm.pdf: projeto experimental para executar um modelo de linguagem em grande escala em um arquivo PDF
Introdução geral O llm.pdf é um projeto de código aberto que permite aos usuários executar modelos de linguagem grandes (LLMs) diretamente em arquivos PDF. Desenvolvido por EvanZhouDev e hospedado no GitHub, esse projeto demonstra uma abordagem inovadora: llama.cpp via Emscripten...
05-05 1130Recomendado
Abogen: uma ferramenta para converter vários formatos de texto em audiolivros
O General Abogen é uma ferramenta de código aberto projetada para converter rapidamente arquivos ePub, PDF ou de texto simples em áudio de alta qualidade. Ele usa o modelo Kokoro-82M para gerar uma fala natural e suave e oferece suporte à geração simultânea de legendas, o que o torna adequado para audiolivros, dublagem de vídeo ou auxílios de aprendizagem. Use...
05-05 770Recomendado
Local Deep Research: uma ferramenta executada localmente para gerar relatórios de pesquisa aprofundados
Introdução geral O Local Deep Research é um assistente de pesquisa de IA de código aberto projetado para ajudar os usuários a realizar pesquisas profundas e gerar relatórios detalhados para problemas complexos. Ele oferece suporte à execução local, permitindo que os usuários concluam tarefas de pesquisa sem depender de serviços em nuvem. A ferramenta combina modelagem local de linguagem grande...
05-05 1060Recomendado
DeepWiki: gerando automaticamente a documentação do repositório do GitHub e usando o diálogo de IA
Introdução geral O DeepWiki é uma ferramenta gratuita da Cognition AI voltada para a geração de documentação estruturada, semelhante à da Wikipédia, para repositórios do GitHub. Ele analisa código, arquivos README e arquivos de configuração para criar automaticamente documentação detalhada e diagramas interativos que ajudam os desenvolvedores a entender rapidamente .....
05-05 1580Recomendado
Trackers: biblioteca de ferramentas de código aberto para rastreamento de objetos de vídeo
Introdução geral O Trackers é uma biblioteca de ferramentas Python de código aberto voltada para o rastreamento de vários objetos em vídeo. Ela integra vários dos principais algoritmos de rastreamento, como o SORT e o DeepSORT, permitindo que os usuários combinem diferentes modelos de detecção de objetos (por exemplo, YOLO, RT-DETR) para uma análise de vídeo flexível. Os usuários ...
05-05 1190Recomendado
Kimi-Audio: processamento de áudio de código aberto e modelo de base de diálogo
Introdução geral O Kimi-Audio é um modelo de base de áudio de código aberto desenvolvido pela Moonshot AI, com foco na compreensão, geração e diálogo de áudio. Ele oferece suporte a várias tarefas de processamento de áudio, como reconhecimento de fala, P&R de áudio e reconhecimento de emoções na fala. O modelo foi pré-treinado com mais de 13 milhões de horas de dados de áudio,...
05-05 930Recomendado
Describe Anything: uma ferramenta de código aberto para gerar descrições detalhadas de imagens e áreas de vídeo
Introdução geral O Describe Anything é um projeto de código aberto desenvolvido pela NVIDIA e por várias universidades, com o Describe Anything Model (DAM) em seu núcleo. Essa ferramenta gera uma imagem ou um vídeo detalhado com base nas áreas marcadas pelo usuário na imagem ou no vídeo (como pontos, caixas, rabiscos ou máscaras)...
05-05 680Recomendado
Cooragent: criando uma ferramenta de colaboração de tarefas de inteligência múltipla em uma única frase
Introdução O Cooragent é uma estrutura de colaboração de agentes de IA de código aberto desenvolvida pelo LeapLab da Universidade de Tsinghua e hospedada no GitHub. Ele permite que os usuários criem agentes de IA inteligentes com uma descrição de uma frase e oferece suporte a vários agentes para colaborar em tarefas complexas. A estrutura oferece dois modos: Agent Factory (Fábrica de agentes)...
05-05 1120Recomendado
InstantCharacter: uma ferramenta de código aberto para gerar caracteres consistentes a partir de uma única imagem
Introdução geral O InstantCharacter é um projeto de código aberto desenvolvido pela Tencent Hunyuan e pela equipe do InstantX, hospedado no GitHub. Ele usa uma imagem de referência e uma descrição de texto para gerar imagens de personagens com aparência consistente para uma variedade de cenas e estilos. O projeto é baseado na var...
05-05 1020Recomendado
Serviço MCP da Claude para gerar relatórios de pesquisa aprofundados
Introdução abrangente O MCP Server Deep Research é uma ferramenta de código aberto que gera automaticamente relatórios de pesquisa estruturados para problemas complexos por meio de inteligência artificial e pesquisa na Web. Os usuários inserem uma pergunta de pesquisa, e a ferramenta divide a pergunta, procura informações confiáveis, avalia a credibilidade da fonte e gera um Markdo com citações...
05-05 1290Recomendado
Deep Recall: uma ferramenta de código aberto que fornece uma estrutura de memória de nível empresarial para modelos grandes
Introdução abrangente O Deep Recall é uma estrutura de memória de código aberto e de classe empresarial projetada para modelos de linguagem grandes (LLMs). Ele oferece capacidade de resposta hiperpersonalizada por meio de recuperação e integração contextuais eficientes. A estrutura usa uma arquitetura de três camadas, incluindo um serviço de memória, um serviço de inferência e um coordenador, e oferece suporte à inferência otimizada por GPU...
05-05 900Recomendado
CleverBee: assistente de pesquisa de IA de código aberto gera estudos de citação
Introdução geral O CleverBee é um assistente de pesquisa de IA de código aberto hospedado no GitHub e desenvolvido pela SureScaleAI. Ele ajuda os usuários a coletar, analisar e resumir informações rapidamente, combinando a tecnologia de navegação na Web com grandes modelos de linguagem (como Gemini e Claude) para gerar pesquisas com citações...
05-05 740Recomendado
FantasyTalking: uma ferramenta de código aberto para gerar retratos falados realistas
Introdução geral O FantasyTalking é um projeto de código aberto desenvolvido pela equipe do Fantasy-AMAP, com foco na geração de vídeos de retratos falados realistas por meio da geração orientada por áudio. O projeto se baseia no modelo avançado de difusão de vídeo Wan2.1, combinado com o codificador de áudio Wav2Vec e pesos de modelos proprietários, usando inteligência artificial ...
05-05 770Recomendado
Paper2Code: transformação automática de documentos de aprendizado de máquina em código executável
Introdução geral O Paper2Code é um projeto de código aberto que visa solucionar o problema da falta de implementações de código para artigos de aprendizado de máquina. Ele transforma automaticamente artigos científicos em repositórios de código executáveis por meio do sistema multiagente Large Language Model (LLM) PaperCoder. O sistema usa um fluxo de três fases de planejamento, análise e geração de código...
05-05 1100Recomendado

Clique para ver mais

Português do Brasil