DeepResearchAgent ist ein von SkyworkAI entwickeltes Open-Source-KI-Tool, das sich auf die Automatisierung von Deep Research konzentriert. Es hilft Nutzern, schnell detaillierte Forschungsberichte zu erstellen, indem es Suchmaschinen, Web-Crawling und Large-Scale Language Modelling (LLM) kombiniert. Benutzer geben einfach ein Forschungsthema oder eine Frage ein, und das Tool sucht automatisch, extrahiert die Informationen und stellt sie in einem strukturierten Bericht zusammen. Das Projekt wird auf GitHub gehostet und bietet Entwicklern, Forschern und Autoren von Inhalten flexible Anpassungsmöglichkeiten und lokale Laufzeitunterstützung. DeepResearchAgent ist für Benutzer geeignet, die komplexe Themen effizient analysieren müssen.
Funktionsliste
- Automatisierte Recherche: Automatisierte Suche und Extraktion relevanter Webinhalte auf der Grundlage von Themen oder Fragen, die vom Benutzer eingegeben werden.
- Intelligente Inhaltsextraktion: Verwendung von Web-Crawling-Technologie zur genauen Extraktion von Schlüsselinformationen aus Webseiten.
- Berichterstellung: Zusammenstellung der Suchergebnisse in einem strukturierten Forschungsbericht mit Zitaten und formatiertem Inhalt.
- Unterstützung des lokalen Betriebs: kann in der lokalen Umgebung des Benutzers ausgeführt werden, um den Datenschutz zu gewährleisten.
- Unterstützung mehrerer LLM: Kompatibel mit OpenAI, Anthropic, Deepseek und anderen mehrsprachigen Modellen.
- Flexible Interaktion: Unterstützt LLM-Interaktion in den Modi Funktionsaufruf und Nicht-Funktionsaufruf.
- Open-Source-Anpassung: Stellt den vollständigen Quellcode zur Verfügung, so dass die Benutzer die Funktionen nach ihren Bedürfnissen ändern und erweitern können.
Hilfe verwenden
Einbauverfahren
DeepResearchAgent muss in Ihrer lokalen Umgebung installiert und konfiguriert werden. Im Folgenden finden Sie detaillierte Installationsschritte für Benutzer, die mit Python und Docker vertraut sind.
- Vorbereiten der Umgebung
Vergewissern Sie sich, dass auf dem System Python 3.10 und Docker installiert sind. Python wird für die Ausführung der Kernprogramme verwendet und Docker für die Containerisierung der Umgebung, um Konsistenz zu gewährleisten.- Python-Version prüfen: run
python --version
und bestätigen, dass die Version 3.10 oder höher ist. - Docker installieren: Besuchen Sie die offizielle Docker-Website, um das Programm herunterzuladen und zu installieren.
- Python-Version prüfen: run
- Klon-Lager
Klonen Sie die Codebase von DeepResearchAgent lokal mit Git:git clone https://github.com/SkyworkAI/DeepResearchAgent.git cd DeepResearchAgent
- Erstellen einer Python-Umgebung
Verwenden Sie Conda, um eine virtuelle Umgebung zu erstellen und zu aktivieren, um Projektabhängigkeiten zu isolieren:conda create -n deep_research python=3.10 conda activate deep_research
- Installation von Abhängigkeiten
Installieren Sie im Stammverzeichnis des Projekts die erforderlichen Python-Abhängigkeiten:pip install -e .
Damit werden die wichtigsten Bibliotheken installiert, die für das Projekt benötigt werden, einschließlich der Web-Crawler-Tools und der Unterstützung der LLM-Schnittstelle.
- Konfigurieren der Docker-Umgebung
DeepResearchAgent verwendet eine interaktive Docker-Container-Umgebung, die das manuelle Ziehen von Images überflüssig macht, da das Programm automatisch das passende Image auf der Grundlage der Gerätearchitektur auswählt. Benutzer müssen erstellen.env
Datei konfiguriert den API-Schlüssel für LLM:- eine Kopie machen von
.env.template
wegen.env
::cp .env.template .env
- Compiler
.env
Datei den API-Schlüssel für das gewünschte LLM (z. B. OpenAI, Deepseek usw.) ein. Es müssen nicht alle API-Schlüssel ausgefüllt werden, konfigurieren Sie nur das Modell, das Sie verwenden möchten.
- eine Kopie machen von
- Auslöseverfahren
Führen Sie den folgenden Befehl aus, um DeepResearchAgent zu starten:auto deep-research
Dadurch wird das Tool in den interaktiven Modus versetzt und ist bereit, Benutzereingaben entgegenzunehmen.
Funktion Betriebsablauf
1. die Studien zur Automatisierung
Nach dem Start des Tools kann der Benutzer ein Forschungsthema oder eine spezifische Frage eingeben. Wenn Sie beispielsweise "Künstliche Intelligenz im Gesundheitswesen" eingeben, sucht das Tool automatisch in Suchmaschinen nach relevanten Informationen, und DeepResearchAgent ruft das integrierte Web-Crawler-Modul auf, um auf Text, Tabellen oder andere strukturierte Daten aus Webseiten zuzugreifen und diese zu extrahieren. Die Benutzer müssen die Suchbegriffe nicht manuell eingeben, das Tool optimiert die Abfrage durch LLM, um qualitativ hochwertige Quellen zu finden.
2. die Extraktion und Zusammenstellung von Inhalten
Die extrahierten Informationen werden von LLM verarbeitet, um die wichtigsten Teile des Themas herauszufiltern. Das Tool entfernt automatisch Werbung, Navigationsleisten und andere irrelevante Inhalte, um sicherzustellen, dass die Ausgabe korrekt ist. Der Benutzer kann wählen, ob er den ursprünglichen Link zur Webseite als Zitat beibehalten möchte oder nicht. Sobald die Extraktion abgeschlossen ist, werden die Informationen in Absätzen, Listen oder Tabellen zusammengefasst, um einen vorläufigen Bericht zu erstellen.
3. die Erstellung von Berichten
DeepResearchAgent unterstützt die Erstellung von strukturierten Berichten mit Einleitung, Hauptinhalt und Referenzen. Die Benutzer können das Berichtsformat, z. B. Markdown oder PDF, über Befehlszeilenparameter beim Start festlegen. Nach der Erstellung des Berichts speichert das Tool diesen automatisch in einem angegebenen Verzeichnis zur einfachen Bearbeitung oder Weitergabe. Der Inhalt des Berichts ist logisch und klar, und das Zitierformat ist standardisiert und eignet sich für akademische oder professionelle Szenarien.
4. lokaler Betrieb und Schutz der Privatsphäre
Die gesamte Datenverarbeitung erfolgt lokal ohne Upload in die Cloud. Die Nutzer können die Datenverarbeitungslogik anpassen, indem sie den Code ändern, z. B. den Suchumfang anpassen oder die Berichtsstruktur optimieren. Der offene Quellcode ermöglicht es den Entwicklern, neue Funktionen hinzuzufügen, z. B. Unterstützung für weitere LLMs oder Integration mit anderen Datenquellen.
5. kompatibel mit einer Vielzahl von LLM
DeepResearchAgent unterstützt eine breite Palette gängiger LLMs, und der Benutzer kann.env
Datei, um den API-Schlüssel zu konfigurieren. Das Tool wählt auf der Grundlage der Konfiguration automatisch ein Modell zur Bearbeitung der Aufgabe aus. Zu den empfohlenen Modellen gehören Deepseek und Grok wegen ihrer stabilen Leistung und geringen Kosten. Benutzer können auch benutzerdefinierte Modelle unterstützen, indem sie den Code ändern.
6. die Befehlszeilenoperationen
Nach dem Start kann der Benutzer über die Befehlszeile interagieren. Zum Beispiel, wenn Sieauto deep-research --topic "区块链技术"
Es werden Berichte für Blockchain-Technologien erstellt. Weitere Parameter sind in der offiziellen Dokumentation verfügbar, z. B. die Einstellung der Berichtssprache oder der Suchtiefe.
caveat
- Sorgen Sie für eine stabile Internetverbindung, damit das Tool auf Suchmaschinen und Webseiten zugreifen kann.
- Prüfen Sie bei der Konfiguration des API-Schlüssels, ob das Modell eine zusätzliche Zahlung erfordert (z. B. GPT-4 für OpenAI).
- Für den lokalen Betrieb sind mindestens 8 GB RAM und eine 4-Kern-CPU erforderlich, um die reibungslose Abwicklung komplexer Aufgaben zu gewährleisten.
- Prüfen Sie das GitHub-Repository regelmäßig auf Updates für die neuesten Funktionen und Fehlerbehebungen.
Anwendungsszenario
- akademische Forschung
Forscher können DeepResearchAgent nutzen, um schnell die neueste Literatur und Informationen zu einem bestimmten Thema zu sammeln. Geben Sie z. B. "Neueste Fortschritte im Quantencomputing" ein, und das Tool durchsucht automatisch akademische Websites, Nachrichten und Blogs, um Berichte mit den wichtigsten Ergebnissen und Zitaten zu erstellen. - Erstellung von Inhalten
Blogger oder Journalisten können das Tool nutzen, um schnell Hintergrundinformationen zu generieren. Wenn Sie zum Beispiel einen Artikel über "Erneuerbare Energie Trends" schreiben, geben Sie das Thema ein und erhalten strukturierte Marktanalysen und Daten. - Unternehmensanalyse
Geschäftskunden können die Marktdynamik oder Informationen über Wettbewerber recherchieren. Geben Sie beispielsweise "Markt für Elektrofahrzeuge 2025" ein, und das Tool wird Branchenberichte, Verkaufsdaten und Trendprognosen zusammenstellen. - Anpassung für Entwickler
Entwickler können auf der Grundlage von Open-Source-Code maßgeschneiderte Recherchetools entwickeln. Fügen Sie beispielsweise spezifische Datenbankschnittstellen hinzu, um ausführliche branchenspezifische Berichte zu erstellen.
QA
- Benötigt DeepResearchAgent eine Internetverbindung?
Ja, das Tool erfordert eine Internetverbindung für den Zugriff auf die Suchmaschine und die Webinhalte. Die Datenverarbeitung und Berichterstellung erfolgt jedoch lokal, um die Privatsphäre der Nutzer zu schützen. - Welche Sprachen werden für die Berichterstattung unterstützt?
Derzeit werden Berichte in Chinesisch, Englisch und anderen Sprachen unterstützt, je nach verwendetem LLM, und der Benutzer kann die Ausgabesprache in der Konfiguration angeben. - Wie kann die Qualität der Suchergebnisse optimiert werden?
Versuchen Sie, bei der Eingabe von Themen so spezifisch wie möglich zu sein, z. B. ist "KI-Chip-Markt 2025" präziser als "KI-Chip". Die Nutzer können die Suchparameter auch nach Code anpassen. - Ist Programmiererfahrung erforderlich?
Für die grundlegende Nutzung ist keine Programmierung erforderlich, die Bedienung über die Befehlszeile ist ausreichend. Für benutzerdefinierte Funktionen sind jedoch Python- und Git-Grundlagen erforderlich.