O DeepResearchAgent é uma ferramenta de IA de código aberto desenvolvida pela SkyworkAI que se concentra na automação de pesquisas profundas. Ela ajuda os usuários a gerar rapidamente relatórios de pesquisa detalhados, combinando mecanismos de pesquisa, rastreamento da Web e modelagem de linguagem em larga escala (LLM). Os usuários simplesmente inserem um tópico ou pergunta de pesquisa, e a ferramenta pesquisa automaticamente, extrai as informações e as agrupa em um relatório estruturado. O projeto está hospedado no GitHub para desenvolvedores, pesquisadores e criadores de conteúdo, com personalização flexível e suporte ao tempo de execução local. Com ênfase na proteção da privacidade e no suporte à implantação local, o DeepResearchAgent é adequado para usuários que precisam analisar tópicos complexos com eficiência.
Lista de funções
- Pesquisa automatizada: pesquisa e extração automatizadas de conteúdo relevante da Web com base em tópicos ou perguntas inseridas pelo usuário.
- Extração inteligente de conteúdo: uso da tecnologia de rastreamento da Web para extrair com precisão as principais informações das páginas da Web.
- Geração de relatórios: agrupe os resultados da pesquisa em um relatório de pesquisa estruturado com citações e conteúdo formatado.
- Suporte à operação local: pode ser executado no ambiente local do usuário para proteger a privacidade dos dados.
- Suporte a vários LLMs: compatível com OpenAI, Anthropic, Deepseek e outros modelos multilíngues.
- Interação flexível: oferece suporte à interação LLM nos modos de chamada de função e chamada sem função.
- Personalização de código aberto: fornece código-fonte completo, permitindo que os usuários modifiquem e ampliem a funcionalidade de acordo com suas necessidades.
Usando a Ajuda
Processo de instalação
O DeepResearchAgent precisa ser instalado e configurado em seu ambiente local. Abaixo estão as etapas de instalação detalhadas para usuários familiarizados com Python e Docker.
- Preparação do ambiente
Certifique-se de que o sistema tenha o Python 3.10 e o Docker instalados, pois o Python é usado para executar os programas principais e o Docker é usado para colocar o ambiente em contêineres para garantir a consistência.- Verificar a versão do Python: run
python --version
confirmando que a versão é 3.10 ou superior. - Instalar o Docker: visite o site oficial do Docker para fazer o download e instalá-lo.
- Verificar a versão do Python: run
- armazém de clones
Clone a base de código do DeepResearchAgent localmente usando o Git:git clone https://github.com/SkyworkAI/DeepResearchAgent.git cd DeepResearchAgent
- Criando um ambiente Python
Use o Conda para criar e ativar um ambiente virtual para isolar as dependências do projeto:conda create -n deep_research python=3.10 conda activate deep_research
- Instalação de dependências
No diretório raiz do projeto, instale as dependências necessárias do Python:pip install -e .
Isso instalará as principais bibliotecas necessárias para o projeto, incluindo ferramentas de rastreamento da Web e suporte à interface LLM.
- Configuração do ambiente do Docker
O DeepResearchAgent usa um ambiente interativo em contêineres do Docker que elimina a necessidade de extrair imagens manualmente, pois o programa seleciona automaticamente a imagem apropriada com base na arquitetura do dispositivo. Os usuários precisam criar.env
configura a chave de API para o LLM:- fazer uma cópia de
.env.template
por causa de.env
::cp .env.template .env
- compilador
.env
preencha a chave de API do LLM desejado (por exemplo, OpenAI, Deepseek, etc.). Nem todas as chaves de API precisam ser preenchidas, basta configurar o modelo que você planeja usar.
- fazer uma cópia de
- procedimento de acionamento
Execute o seguinte comando para iniciar o DeepResearchAgent:auto deep-research
Isso iniciará a ferramenta no modo interativo, pronta para aceitar a entrada do usuário.
Função Fluxo de operação
1. estudos de automação
Depois de iniciar a ferramenta, o usuário pode inserir um tópico de pesquisa ou uma pergunta específica. Por exemplo, se você digitar "inteligência artificial na área da saúde", a ferramenta procurará automaticamente informações relevantes nos mecanismos de pesquisa, e o DeepResearchAgent chamará o módulo de rastreamento da Web incorporado para acessar e extrair texto, tabelas ou outros dados estruturados de páginas da Web. Os usuários não precisam especificar manualmente os termos de pesquisa, a ferramenta otimizará a consulta por meio do LLM para encontrar fontes de alta qualidade.
2. extração e agrupamento de conteúdo
As informações extraídas são processadas pelo LLM para filtrar as partes mais relevantes do tópico. A ferramenta remove automaticamente anúncios, barras de navegação e outros conteúdos irrelevantes para garantir que o resultado seja preciso. Os usuários podem optar por manter ou não o link da página da Web original como uma citação. Após a conclusão da extração, as informações são agrupadas em parágrafos, listas ou tabelas para gerar um relatório preliminar.
3. geração de relatórios
O DeepResearchAgent suporta a geração de relatórios estruturados com introdução, conteúdo principal e referências. Os usuários podem especificar o formato do relatório, por exemplo, Markdown ou PDF, por meio de parâmetros de linha de comando na inicialização e, após gerar o relatório, a ferramenta o salvará automaticamente em um diretório especificado para facilitar a edição ou o compartilhamento. O conteúdo do relatório é lógico e claro, e o formato de citação é padronizado, adequado para cenários acadêmicos ou profissionais.
4. operação local e proteção da privacidade
Todo o processamento de dados é feito localmente, sem upload para a nuvem. Os usuários podem personalizar a lógica de processamento de dados modificando o código, por exemplo, ajustando o escopo da pesquisa ou otimizando a estrutura do relatório. O código-fonte aberto permite que os desenvolvedores adicionem novos recursos, como suporte para mais LLMs ou integração com outras fontes de dados.
5. compatível com uma variedade de LLM
O DeepResearchAgent oferece suporte a uma ampla gama de LLMs convencionais, e o usuário pode.env
para configurar a chave da API. A ferramenta seleciona automaticamente um modelo para lidar com a tarefa com base na configuração. Os modelos recomendados incluem o Deepseek e o Grok para desempenho estável e baixo custo. Os usuários também podem oferecer suporte a modelos personalizados modificando o código.
6. operações de linha de comando
Uma vez iniciado, o usuário pode interagir por meio da linha de comando. Por exemplo, ao executarauto deep-research --topic "区块链技术"
Serão gerados relatórios para tecnologias de blockchain. Mais parâmetros estão disponíveis na documentação oficial, como a configuração do idioma do relatório ou a profundidade da pesquisa.
advertência
- Garanta uma conexão estável com a Internet para que a ferramenta possa acessar mecanismos de pesquisa e páginas da Web.
- Ao configurar a chave de API, verifique se o modelo exige pagamento adicional (por exemplo, GPT-4 para OpenAI).
- A operação local requer pelo menos 8 GB de RAM e uma CPU de 4 núcleos para garantir o manuseio suave de tarefas complexas.
- Verifique regularmente o repositório do GitHub para obter atualizações dos recursos e correções mais recentes.
cenário do aplicativo
- pesquisa acadêmica
Os pesquisadores podem usar o DeepResearchAgent para reunir rapidamente a literatura e as informações mais recentes em um campo específico. Por exemplo, digite "últimos avanços em computação quântica" e a ferramenta rastreará automaticamente sites acadêmicos, notícias e blogs para gerar relatórios com as principais descobertas e citações. - criação de conteúdo
Blogueiros ou jornalistas podem usar a ferramenta para gerar rapidamente informações básicas. Por exemplo, ao escrever um artigo sobre "Tendências de energia renovável", insira o tópico e obtenha análises e dados de mercado estruturados. - Análise de negócios
Os usuários corporativos podem pesquisar a dinâmica do mercado ou informações sobre a concorrência. Por exemplo, digite "Electric Vehicle Market 2025" e a ferramenta reunirá relatórios do setor, dados de vendas e previsões de tendências. - Personalização do desenvolvedor
Os desenvolvedores podem desenvolver ferramentas de pesquisa personalizadas com base no código-fonte aberto. Por exemplo, adicionar interfaces de banco de dados específicas para gerar relatórios detalhados específicos do setor.
QA
- O DeepResearchAgent requer uma conexão com a Internet?
Sim, a ferramenta requer uma conexão com a Internet para acessar o mecanismo de pesquisa e o conteúdo da Web. No entanto, o processamento de dados e a geração de relatórios são feitos localmente para proteger a privacidade do usuário. - Quais idiomas são compatíveis com os relatórios?
Atualmente, suporta relatórios em chinês, inglês e outros idiomas, dependendo do LLM usado, e o usuário pode especificar o idioma de saída na configuração. - Como otimizar a qualidade dos resultados de pesquisa?
Tente ser o mais específico possível ao inserir tópicos, por exemplo, "AI chip market 2025" é mais preciso do que "AI chip". Os usuários também podem ajustar os parâmetros de pesquisa por código. - É necessário ter experiência em programação?
Não é necessário programar para o uso básico, a operação da linha de comando é suficiente. Entretanto, as funções personalizadas exigem noções básicas de Python e Git.