Web Analytics Made Easy - Statcounter
Skip to content

Duckling

Eine moderne, benutzerfreundliche grafische Oberfläche für Docling – die leistungsstarke Dokumentkonvertierungsbibliothek von IBM.

Duckling Screenshot

Überblick

Duckling bietet eine intuitive Web-Oberfläche zur Konvertierung von Dokumenten mit IBMs Docling-Bibliothek. Ob Sie Text aus PDFs extrahieren, Word-Dokumente nach Markdown konvertieren oder OCR für gescannte Bilder durchführen möchten – Duckling macht es einfach.

Hauptfunktionen

  • Drag-and-Drop-Upload


    Ziehen Sie Ihre Dokumente einfach auf die Oberfläche für sofortige Verarbeitung

  • Stapelverarbeitung


    Konvertieren Sie mehrere Dateien gleichzeitig mit paralleler Verarbeitung

  • Multi-Format-Unterstützung


    PDFs, Word-Dokumente, PowerPoints, Excel-Dateien, HTML, Markdown, Bilder und mehr

  • Mehrere Exportformate


    Exportieren Sie nach Markdown, HTML, JSON, DocTags, Document Tokens, RAG Chunks oder Klartext

  • Bild- und Tabellenextraktion


    Extrahieren Sie eingebettete Bilder und Tabellen mit CSV-Export

  • RAG-optimiertes Chunking


    Generieren Sie Dokument-Segmente, die für RAG-Anwendungen optimiert sind

  • Erweiterte OCR


    Mehrere OCR-Backends mit GPU-Beschleunigungsunterstützung

  • Konvertierungsverlauf


    Greifen Sie jederzeit auf zuvor konvertierte Dokumente zu

  • Konvertierungsstatistiken


    Analyse-Panel mit Durchsatz, Speichernutzung und Leistungsmetriken

Schnellstart

Starten Sie in wenigen Minuten:

Ein-Befehl-Start mit vorgefertigten Images:

curl -O https://raw.githubusercontent.com/davidgs/duckling/main/docker-compose.prebuilt.yml && docker-compose -f docker-compose.prebuilt.yml up -d

Oder lokal erstellen:

git clone https://github.com/davidgs/duckling.git
cd duckling
docker-compose up --build

# Repository klonen
git clone https://github.com/davidgs/duckling.git
cd duckling

# Backend-Einrichtung
cd backend
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
python duckling.py

# Frontend-Einrichtung (neues Terminal)
cd frontend
npm install
npm run dev

Greifen Sie auf die Anwendung unter http://localhost:3000 zu

Unterstützte Formate

Eingabeformate

Format Erweiterungen Beschreibung
PDF .pdf Portable Document Format
Word .docx Microsoft Word-Dokumente
PowerPoint .pptx Microsoft PowerPoint-Präsentationen
Excel .xlsx Microsoft Excel-Tabellenkalkulationen
HTML .html, .htm Webseiten
Markdown .md, .markdown Markdown-Dateien
Bilder .png, .jpg, .jpeg, .tiff, .gif, .webp, .bmp Direkte Bild-OCR
AsciiDoc .asciidoc, .adoc Technische Dokumentation
PubMed XML .xml Wissenschaftliche Artikel
USPTO XML .xml Patentdokumente

Exportformate

Format Erweiterung Beschreibung
Markdown .md Formatierter Text mit Überschriften, Listen, Links
HTML .html Web-fertiges Format mit Styling
JSON .json Vollständige Dokumentstruktur
Klartext .txt Einfacher Text ohne Formatierung
DocTags .doctags Markiertes Dokumentformat
Document Tokens .tokens.json Token-Ebene-Darstellung
RAG Chunks .chunks.json Chunks für RAG-Anwendungen

Architektur

graph LR
    A[Browser] --> B[React Frontend]
    B --> C[Flask Backend]
    C --> D[Docling Engine]
    D --> E[(Storage)]

    style A fill:#3b82f6,color:#fff
    style B fill:#1e3a5f,color:#fff
    style C fill:#14b8a6,color:#fff
    style D fill:#8b5cf6,color:#fff
    style E fill:#f59e0b,color:#fff

Dokumentation