Allgemeine Einführung
CleverBee ist ein Open-Source-KI-Forschungsassistent, der auf GitHub gehostet und von SureScaleAI entwickelt wird. Er ist für die KI-Forschung durch große Sprachmodelle (z. B. Zwillinge CleverBee ist eine Web-Browsing-Lösung, die Web-Browsing-Technologie mit der Fähigkeit kombiniert, Informationen schnell zu sammeln, zu analysieren und zusammenzufassen, um zitierfähige Forschungsberichte zu erstellen. CleverBee unterstützt sowohl Cloud- als auch lokale Modelle und eignet sich für die akademische Forschung, Unternehmensanalysen und andere Szenarien. Seine Schnittstelle basiert auf Chainlit, mit einfacher und intuitiver Bedienung und flexibler Konfiguration, geeignet für Einzelpersonen und Forschungsteams.
Funktionsliste
- Unterstützung für eine breite Palette von großen Sprachmodellen, einschließlich Gemini, Claude und nativer GGUF-Modelle.
- Automatisieren Sie das Web-Browsing, extrahieren Sie HTML-Inhalte und bereinigen Sie sie in strukturierte Daten.
- Erstellen Sie eine Forschungsarbeit mit Zitaten, einschließlich Quellenangaben und Anmerkungen zu Einschränkungen.
- Unterstützt die Extraktion von YouTube-Videountertiteln, PDF-Parsing und die wissenschaftliche Suche in PubMed.
- Bietet Echtzeit-Token-Nutzung und Kostenverfolgung zur Optimierung der Ressourcenverwaltung.
- passieren (eine Rechnung oder Inspektion etc.)
config.yaml
Dokumentieren Sie Anpassungsmodelle, Browserverhalten und Recherchetools. - Integrierte interaktive Chainlit-Benutzeroberfläche für die Eingabe von Abfragen und die Anzeige von Ergebnissen.
- Verbessern Sie die Leistung und reduzieren Sie die Kosten, indem Sie den NormalizingCache-Cache der SQLite-Datenbank verwenden.
Hilfe verwenden
Einbauverfahren
CleverBee ist einfach zu installieren. Eine ausführliche Anleitung ist über ein GitHub-Repository verfügbar. Hier sind die Schritte:
- Klon-Lager
Öffnen Sie ein Terminal und führen Sie den folgenden Befehl aus, um das CleverBee-Repository zu klonen:git clone https://github.com/SureScaleAI/cleverbee.git cd cleverbee
- Führen Sie das Installationsskript aus
Führen Sie das Installationsskript aus, um die Umgebung zu konfigurieren:bash setup.sh
Das Skript automatisiert die folgenden Aufgaben:
- Prüfen Sie auf notwendige Abhängigkeiten (z.B.
python3
undjq
undyq
im Gesang antwortencmake
). - Erstellen Sie eine virtuelle Python-Umgebung (
venv/
). - Montage
requirements.txt
Python-Abhängigkeiten in der - Erkennt die Hardware und fragt, ob das lokale Modell aktiviert ist (empfohlener NVIDIA-Grafikprozessor mit ≥ 24 GB Videospeicher).
- Wenn ein lokales Modell gewählt wird, wird die Installation
llama-cpp-python
und aktivieren Sie die CUDA-Beschleunigung (für NVIDIA-GPUs). - Fordert den Benutzer auf, sich beim Hugging Face anzumelden (bei Verwendung eines lokalen Modells).
- Helfen Sie bei der Konfiguration des Hauptinferenzmodells und des Zusammenfassungsmodells, aktualisieren Sie die
config.yaml
. - Laden Sie ausgewählte lokale GGUF-Modelle herunter (falls zutreffend).
- Prüfen Sie auf notwendige Abhängigkeiten (z.B.
- API-Schlüssel konfigurieren
Wenn Sie ein Cloud-Modell wie Gemini oder Claude verwenden, ist ein API-Schlüssel erforderlich. Das Installationsskript prüft die Auswahl des Modells und weist den Benutzer an, den Schlüssel in das Feld.env
Dokumentation:- Anthropischer API-Schlüssel: Von Anthropisch Konsolenerfassung für Claude Modelle.
- Google Gemini API-Schlüssel: Von Google AI Studio Holen Sie sich, für Gemini-Modelle.
Nachdem der Schlüssel hinzugefügt wurde, muss die Anwendung neu gestartet werden, damit er wirksam wird. Benutzer können die.env
Datei-Aktualisierungsschlüssel.
- eine Anwendung starten
Nachdem die Installation abgeschlossen ist, führen Sie den folgenden Befehl aus, um CleverBee zu starten:bash run.sh
Dadurch wird die interaktive Schnittstelle von Chainlit gestartet, auf die der Benutzer über einen Browser zugreifen kann.
Systemanforderungen
- BetriebssystemUnterstützung für macOS (Intel und Apple Silicon, erfordert Rosetta 2) und Linux.
- SoftwareFür Cloud-Modelle ist keine Hochleistungshardware erforderlich; für lokale Modelle werden NVIDIA-GPUs (Grafikspeicher ≥ 24 GB) empfohlen.
- AbhängigkeitenVergewissern Sie sich, dass die Installation
python3
undgit
undjq
undcmake
im Gesang antwortennode
macOS-Benutzer können es über Homebrew installieren:brew install python cmake git jq node
Verwendung
Die Kernfunktion von CleverBee besteht darin, Forschungsberichte mit Zitaten zu erstellen. Im Folgenden finden Sie die detaillierte Vorgehensweise:
- Schnittstelle starten
in Bewegung seinrun.sh
Der Browser öffnet dann die Chainlit-Schnittstelle. Hier kann der Nutzer eine Forschungsfrage oder ein Thema eingeben, z. B. "Jüngste Fortschritte im Quantencomputing" oder "Wirtschaftliche Auswirkungen nachhaltiger Energie". - Eingabe einer Abfrage
Nach Eingabe einer Frage in das Eingabefeld der Benutzeroberfläche erstellt CleverBee automatisch einen Recherchepfad und ruft Web-Browsing-Tools, YouTube-Untertitel-Extraktion oder akademische Suchmodule auf, um Informationen zu sammeln. Die Nutzer können den Fortschritt ihrer Recherche in Echtzeit verfolgen. - Bericht ansehen
Nach Abschluss der Studie erstellt CleverBee einen Bericht, der Folgendes enthält:- Synthetisieren und Zusammenfassen: Auf der Grundlage der gesammelten Informationen prägnante Schlussfolgerungen ziehen.
- Quellenangaben: Geben Sie Links oder Quellen für alle Verweise an.
- Hinweis auf Einschränkungen: Beschreibt mögliche Einschränkungen der KI und erinnert die Benutzer daran, die Quelle zu überprüfen.
- Token Usage: zeigt den Ressourcenverbrauch bei Modellaufrufen.
- Benutzerdefinierte Konfiguration
Vom Benutzer editierbarconfig.yaml
Die Datei passt zum Beispiel Einstellungen an:- Ändern Sie das Hauptinferenzmodell (Gemini 2.5 Pro empfohlen).
- Einstellung des Proxy-Verhaltens (z. B. Web-Browsing-Tiefe).
- Passen Sie Token-Limits oder Caching-Richtlinien an.
Die Konfigurationsdokumentation befindet sich in derhttps://cleverb.ee/docs
.
- Featured Function Bedienung
- Extraktion von YouTube-UntertitelnGeben Sie einen Link zu einem YouTube-Video ein und CleverBee extrahiert automatisch die Untertitel und integriert sie in den Bericht, der sich für die Analyse von Vorlesungen oder Interviews eignet.
- PDF-ParsenLaden Sie eine PDF-Datei hoch, und CleverBee extrahiert den Text und fasst die wichtigsten Elemente zusammen, die für akademische Arbeiten oder Berichte geeignet sind.
- PubMed-SucheGeben Sie ein medizinisches Thema ein, und CleverBee durchsucht die maßgebliche Literatur in der Datenbank PubMed.
- Kostenverfolgung in EchtzeitDie Schnittstelle zeigt den Token-Verbrauch pro Abfrage an, damit die Nutzer ihr Budget optimieren können.
caveat
- Lokale Modelle haben hohe Hardware-Anforderungen, und für eine optimale Leistung werden Cloud-Modelle empfohlen.
- Überprüfen Sie immer die Quellen in dem Bericht, denn die KI könnte halluzinieren.
- Das Projekt ist für nicht-kommerzielle Zwecke bestimmt und unterliegt der GNU Affero Lizenz.
Anwendungsszenario
- akademische Forschung
Studenten oder Forscher können mit CleverBee schnell akademische Arbeiten, Webartikel und Videos sammeln, um eine vollständig zitierte Literaturübersicht zu erstellen. Wenn Sie beispielsweise zum Thema "Ethik der künstlichen Intelligenz" recherchieren, kann CleverBee relevante Literatur aus PubMed und akademischen Websites extrahieren. - Unternehmensanalyse
Geschäftskunden können Markttrends oder Informationen über Wettbewerber analysieren. Geben Sie zum Beispiel "Electric Vehicle Market Forecast 2025" ein, und CleverBee durchsucht Branchenberichte und Nachrichten, um eine datengestützte Zusammenfassung zu erstellen. - Persönliches Lernen
Für Gelegenheitsnutzer, die komplexe Themen wie "Anwendungen der Blockchain-Technologie" erforschen, bietet CleverBee mehrere Perspektiven, darunter YouTube-Tutorials und maßgebliche Artikel, um den Nutzern ein umfassendes Verständnis zu vermitteln.
QA
- Welche Modelle werden von CleverBee unterstützt?
Unterstützung für Gemini, Claude und native GGUF-Modelle (z.B. Deepseek (R1, Llama). Cloud-Modelle sind stabiler in der Leistung und lokale Modelle sind für Datenschutzanforderungen geeignet. - Wie lassen sich die Betriebskosten senken?
Reduzieren Sie doppelte Abfragen mit NormalisingCache-Caching. Wählen Sie ein kostengünstiges Modell wie Gemini 2.5 Flash und überwachen Sie die Token-Nutzung über die Schnittstelle. - Ist der Bericht zuverlässig?
Die Berichte beruhen auf authentischen Quellen und sind mit Zitaten versehen, aber AI kann Halluzinationen haben. Den Nutzern wird empfohlen, die wichtigsten Informationen zu überprüfen. - Ist Programmiererfahrung erforderlich?
Es sind keine Programmierkenntnisse erforderlich. Installationsskripte automatisieren die Konfiguration und die Chainlit-Schnittstelle ist einfach zu bedienen.