Zugang aus Übersee: www.kdjingpai.com

Ctrl + D Lesezeichen für diese Seite

OCR

 Website einreichen

VOP: OCR-Tool zum Extrahieren komplexer Diagramme und mathematischer Formeln
Versatile OCR Program ist ein Open-Source-Tool für die optische Zeichenerkennung (OCR), das für die Verarbeitung komplexer akademischer und pädagogischer Dokumente entwickelt wurde. Es kann Text, Tabellen, mathematische Formeln, Diagramme und Schemata aus PDF-, Bild- und anderen Dokumenten extrahieren und strukturierte Daten erzeugen, die für das Training von maschinellem Lernen geeignet sind. Unterstützt...
04-12 6860Gelobt
Automatisches Parsen von PDF-Inhalten und Extrahieren von Text und Tabellen von Open-Source-Diensten
Es analysiert automatisch das Layout von PDF-Dokumenten, identifiziert Text, Titel, Bilder, Tabellen, Formeln und andere Elemente auf der Seite und bestimmt ihre richtige Reihenfolge. Das Tool unterstützt OCR-Funktionalität, Sie können gescannte PDFs in durchsuchbaren Text umwandeln. Es läuft auf Docker und bietet zwei Modelle: visuelles Modell (Vision Grid ...
04-09 8240Gelobt
RolmOCR: Dokument-OCR-Modell zur Erkennung von handgeschriebenen und schrägen Schriftzeichen
RolmOCR ist ein Open-Source-Tool zur optischen Zeichenerkennung (OCR), das vom Reducto AI-Team entwickelt wurde und auf dem visuellen Sprachmodell Qwen2.5-VL-7B basiert. Es kann Text aus Bildern und PDF-Dateien schneller als ähnliche Tools extrahieren olmOCR, geringerer Speicherbedarf.RolmOCR...
04-07 8390Gelobt
uniOCR: plattformübergreifendes Open-Source-Tool zur Texterkennung
uniOCR ist ein Open-Source-Tool zur Texterkennung, das vom mediar-ai-Team entwickelt wurde. Es basiert auf der Sprache Rust und unterstützt macOS, Windows und Linux Systeme. Benutzer können es verwenden, um Text aus Bildern zu extrahieren, einfach zu bedienen und kostenlos. uniOCRs Kernfunktionen sind plattformübergreifende Unterstützung...
04-04 6950Gelobt
PDF Craft: Gescannte PDF-Dokumente in Markdown umwandeln Open-Source-Tools
PDF Craft ist ein Open-Source-Tool, mit dem PDFs von Büchern gescannt und in das Markdown-Format konvertiert werden können. Es wird von oomol-lab entwickelt und auf GitHub für Benutzer gehostet, die ihre eBooks organisieren möchten. Das Tool läuft über ein lokales KI-Modell und benötigt keine Internetverbindung, was die Privatsphäre schützt und die Bedienung erleichtert. ....
03-24 1.1 K0Gelobt
SmolDocling: ein visuelles Sprachmodell für die effiziente Verarbeitung von Dokumenten in einem kleinen Volumen
SmolDocling ist ein Visual Language Model (VLM), das vom ds4sd-Team in Zusammenarbeit mit IBM entwickelt wurde. Es basiert auf SmolVLM-256M und wird auf der Hugging Face-Plattform gehostet. SmolDocling ist das kleinste VLM der Welt mit nur 256M Parametern, und seine Kernfunktion ist...
03-18 9720Gelobt
Mistral OCR: 94,89% Gesamtgenauigkeit, 1000 Seiten/30 Sekunden, nur $1
In der langen Geschichte der menschlichen Zivilisation hat jeder Sprung in der Art und Weise, wie Informationen erworben und ausgewertet werden, den sozialen Fortschritt entscheidend vorangetrieben. Von den antiken Hieroglyphen über den tragbaren Papyrus bis hin zur späteren Entwicklung des Buchdrucks und der heutigen digitalen Welle hat jede technologische Innovation die Weitergabe von menschlichem Wissen erheblich erweitert...
03-07 9210Gelobt
Ollama OCR: Extrahieren von Text aus Bildern mithilfe visueller Modelle in Ollama
Ollama OCR ist ein leistungsstarkes Toolkit für die optische Zeichenerkennung (OCR), das das hochmoderne visuelle Sprachmodell der Ollama-Plattform nutzt, um Text aus Bildern zu extrahieren. Das Projekt ist sowohl als Python-Paket verfügbar als auch mit einer benutzerfreundlichen Streamlit-Webanwendungsschnittstelle. Es unterstützt eine breite Palette von visuellen Modellen...
01-10 2.3 K0Gelobt
STranslate
STranslate ist ein gebrauchsfertiges Übersetzungs- und OCR-Tool, das von WPF entwickelt wurde. Das Tool wurde entwickelt, um eine effiziente und bequeme Übersetzung und OCR-Funktionalität (Optical Character Recognition) für eine Vielzahl von Sprachen und Texttypen zu bieten.STranslate ist ein Open-Source-Projekt, das für Benutzer kostenlos heruntergeladen und...
12-25 1.2 K0Gelobt
VisionParser: OCR-Tool für die hochpräzise Verarbeitung von Belegen und Rechnungen, API verfügbar
VisionParser ist ein OCR-Tool (Optical Character Recognition) für die Verarbeitung von Quittungen und Rechnungen. Dank der fortschrittlichen generativen KI-Technologie kann VisionParser alle Arten von Quittungen und Rechnungen schnell und präzise in strukturierte Daten für eine Vielzahl von Geschäftsszenarien umwandeln, z. B. für den Einzelhandel, die Gastronomie, B2B-Dienstleistungen usw. ....
12-18 1.2 K0Gelobt
Chunkr: ein All-in-One-Dienst, der visuelle Modelle für die Aufnahme von Dokumenten und intelligentes Chunking auf der Grundlage von Textabsatzhierarchien verwendet
Chunkr ist eine selbst gehostete API zur Konvertierung von PDF-, PPTX-, DOCX- und Excel-Dateien in Daten, die für die Verwendung in RAG (Retrieval Augmented Generation) und LLM (Large Language Modelling) geeignet sind. Es wurde von Lumina AI Inc. entwickelt und verwendet fortschrittliche visuelle Modelle für...
12-13 1.4 K0Gelobt
Llama OCR: OCR-Bibliothek, die Bilder in drei Zeilen Code in Markdown umwandelt und dabei die kostenlose Llama 3.2 Vision-Schnittstelle verwendet
Llama OCR ist eine OCR-Bibliothek (Optical Character Recognition), die auf Llama 3.2 Vision basiert und Dokumente in das Markdown-Format konvertiert. Die Bibliothek wurde von Nutlope entwickelt und verwendet die kostenlose Llama 3.2-Schnittstelle, die von Together AI für...
12-11 1.7 K0Gelobt
Docling: Unterstützung für eine Vielzahl von Formaten, Dokumentenparsing und Export als Markdown und JSON, PDF-Unterstützung OCR
Docling ist ein leistungsfähiges Tool zum Parsen und Exportieren von Dokumenten, das eine Vielzahl von Dokumentenformaten unterstützt, darunter PDF, DOCX, PPTX, XLSX, Image, HTML, AsciiDoc und Markdown. Es analysiert und exportiert diese Dokumente in die Formate HTML, Markdown und JSON....
12-09 2.2 K0Gelobt
ViTLP: Extraktion von strukturierten Daten aus typografisch komplexen PDF-Dokumenten und visuell geführte Generierung von vortrainierten Modellen für das Textlayout
ViTLP (Visually Guided Generative Text-Layout Pre-training for Document Intelligence) ist ein Open-Source-Projekt, das darauf abzielt, die Verarbeitung von Dokumenten durch visuell geführte generative Text-Layout Pre-training-Modelle zu verbessern ...
12-03 1.3 K0Gelobt
ScreenPipe: 24-Stunden-Sammlung von aufgezeichneten Bildschirm- und Betriebsinformationen und Umwandlung in eine lokale Wissensbasis, durch den KI-Assistenten Dialog, Zusammenfassung, Überprüfung von Wissen
ScreenPipe ist ein von mediar-ai entwickelter KI-Assistent, der sich auf die Aufnahme von Bildschirminhalten, Screenshots und Audio 24/7 konzentriert. Er kombiniert die Technologien von rewind.ai und cursor.com, um aufgezeichnete Daten in einer lokalen Datenbank zu speichern und unterstützt chinesische...
11-20 1.8 K0Gelobt
Textextraktions-API (text-extract-api): visuelle Extraktion von Textinformationen, anonymisiertes PDF-Extraktionswerkzeug
Die Textextraktions-API (text-extract-api) ist ein leistungsfähiges Tool zum Extrahieren und Parsen von Inhalten aus einer Vielzahl von Dokumentformaten (z. B. PDF, Word, PPTX usw.). Die API nutzt modernste OCR-Technologie (Optical Character Recognition) und von Ollama unterstützte Modelle, um jedes beliebige Dokument oder Bild in einen Knoten zu konvertieren ....
11-05 1.6 K0Gelobt
Picture to Excel Free Tool: Effizientes Erkennen von Tabellen mit komplexen Formatierungen in Bildern und Konvertieren in Excel-Dateien
Picture to Excel Free Tool ist ein effizientes Online-Tool, das schnell und präzise Tabellendaten aus Bildern identifiziert und in Excel-Dateien konvertiert. Das Tool unterstützt eine Vielzahl von Bildformaten, wie JPG und PNG, und kann auf Webseiten, iOS-Apps und Android-Apps verwendet werden. Mit fortschrittlicher KI-Technologie kann der...
11-01 1.5 K0Gelobt
Datalab: spezielles KI-Modell für OCR-Erkennung, PDF zu Markdown (Open Source/API)
Datalab bietet eine Reihe von fortschrittlichen KI-Modellen mit Schwerpunkt auf OCR, Layout-Analyse, PDF zu Markdown und mehr. Diese Modelle sind nicht nur leistungsstark, sondern auch einfach zu bedienen und quelloffen. Die Marker-Modelle auf der Plattform können PDF schnell und präzise in Markdown konvertieren, einschließlich Tabellen und Formeln...
10-21 1.7 K0Gelobt
eSearch: Multifunktionales plattformübergreifendes OCR-Tool, integrierte Suche | Übersetzung | Suchkarte | Bildschirmaufzeichnung und weitere Funktionen
eSearch ist ein plattformübergreifendes Open-Source-Screenshot-Tool, das von xushengfeng für Windows, macOS und Linux entwickelt wurde. Es integriert eine Vielzahl von Funktionen wie Screenshot, OCR-Erkennung, Suche, Übersetzung, Mapping, Bildsuche und Bildschirmaufzeichnung. eSearch verwendet Elec...
10-14 1.4 K0Gelobt

Deutsch