Web Analytics Made Easy - Statcounter
Skip to content

Duckling

Eine moderne, benutzerfreundliche Web-Oberfläche für Docling (IBM) – eine leistungsstarke Bibliothek zur Dokumentkonvertierung.

Duckling Screenshot

Überblick

Duckling bietet eine intuitive Web-Oberfläche, um Dokumente mit Docling zu konvertieren. Ob du Text aus PDFs extrahieren, Word-Dokumente nach Markdown konvertieren oder OCR für gescannte Bilder nutzen möchtest: Duckling macht es einfach.

Hauptfunktionen

Schnellstart

Siehe Erste Schritte, um Duckling mit Docker oder in der lokalen Entwicklung zu installieren und auszuführen. Eine kompakte Anleitung steht im Schnellstart.

Unterstützte Formate

Eingabeformate

Format Erweiterungen Beschreibung
PDF .pdf Portable Document Format
Word .docx Microsoft Word-Dokumente
PowerPoint .pptx Microsoft PowerPoint-Präsentationen
Excel .xlsx Microsoft Excel-Tabellenkalkulationen
HTML .html, .htm Webseiten
Markdown .md, .markdown Markdown-Dateien
Bilder .png, .jpg, .jpeg, .tiff, .gif, .webp, .bmp Direkte Bild-OCR
AsciiDoc .asciidoc, .adoc Technische Dokumentation
PubMed XML .xml Wissenschaftliche Artikel
USPTO XML .xml Patentdokumente

Exportformate

Format Erweiterung Beschreibung
Markdown .md Formatierter Text mit Überschriften, Listen, Links
HTML .html Web-fertiges Format mit Styling
JSON .json Vollständige Dokumentstruktur
Klartext .txt Einfacher Text ohne Formatierung
DocTags .doctags Markiertes Dokumentformat
Document Tokens .tokens.json Token-Ebene-Darstellung
RAG Chunks .chunks.json Chunks für RAG-Anwendungen

Architektur

graph LR
    A[Browser] --> B[React-Frontend]
    B --> C[Flask-Backend]
    C --> D[Docling-Engine]
    D --> E[(Speicher)]

    style A fill:#3b82f6,color:#fff
    style B fill:#1e3a5f,color:#fff
    style C fill:#14b8a6,color:#fff
    style D fill:#8b5cf6,color:#fff
    style E fill:#f59e0b,color:#fff

Dokumentation

Danksagungen