Changelog
Alle bemerkenswerten Änderungen an diesem Projekt werden in dieser Datei dokumentiert.
Das Format basiert auf Keep a Changelog, und dieses Projekt folgt der Semantischen Versionierung.
Neueste Version: 0.0.11 (2026-03-30)
[Unveröffentlicht]
Dokumentation
- Bereitstellung: deployment/index.md, deployment/production.md, deployment/scaling.md und deployment/security.md vollständig übersetzt (Mermaid-Beschriftungen lokalisiert); Deployment-Startseite: vollständige Übersicht und bereinigte Checkliste.
- Erste Schritte: index.md, installation.md, quickstart.md und docker.md vollständig übersetzt; analog
fr/es; englische docker.md CI/CD-Formulierung präzisiert. - Benutzerhandbuch: Unterstützte Formate und Screenshot-Galerie vollständig übersetzt; entsprechende Seiten in
fr/es. - Schnellstart: Abschnitt „Mehrere Dateien auf einmal“ in getting-started/quickstart.md beschreibt Ordner per Drag-and-drop, Klick auf die Zone zur Ordnerauswahl und Dateien wählen… für mehrere Einzeldateien; analog in
fr/es. - Französisch / Englisch: Die französische Seite
fr/user-guide/features.mdist vollständig übersetzt (Überschriften für die Seitenleisten-TOC); doppelter „Statistics Panel“-Abschnitt in der englischen user-guide/features.md entfernt. - Startseiten: index.md verlinkt die Docling-Dokumentation wie die englische Homepage;
fr/esKacheln auf der Startseite zeigen auf sprachspezifische Anker auf der Features-Seite; französische Startseite mit Dokumentationsliste, Schnellstart-Links und Danksagungen; spanische Startseite verlinktes/changelog.md. - Benutzerhandbuch: Features und Konfiguration vollständig übersetzt; ebenfalls
fr/esFeatures undfr/esKonfiguration. - Architektur / Einstieg Benutzerhandbuch: architecture/index.md und user-guide/index.md durchgängig auf Deutsch (inkl. Technologie-Tabelle); Titel Benutzerhandbuch auf der Benutzerhandbuch-Startseite korrigiert.
- API: api/index.md, api/conversion.md, api/settings.md und api/history.md vollständig übersetzt; Entsprechendes unter
fr/api/undes/api/. - Architektur (Detailseiten): architecture/overview.md, architecture/components.md und architecture/diagrams.md vollständig übersetzt; Entsprechendes unter
fr/architecture/undes/architecture/. - Mitwirken: Alle Seiten unter contributing/ übersetzt; stabile Anker
{#commit-messages}und{#dco-sign-off}in contributing/code-style.md. - Docling / Screenshots: docling/index.md um Abschnitt „Seiten aktualisieren“ ergänzt; images/README.md für Screenshots vollständig auf Deutsch.
Geplant
- Benutzerauthentifizierung
- Cloud-Speicher-Integration
- Konvertierungsvorlagen
- API-Ratenbegrenzung
- WebSocket für Echtzeit-Updates
- Dunkel-/Hell-Theme-Umschalter
- Tastaturkürzel
- Barrierefreiheitsverbesserungen (WCAG 2.1)
0.0.11 - 2026-03-30
Geändert
- Upload-UX: Vereinheitlichte Ablagezone ohne separaten Stapel-Schalter in der Kopfzeile; siehe
CHANGELOG.mdim Repository-Root. - Abhängigkeiten: Keine separate
requirements-docs.txtim Stamm mehr; nur nochbackend/requirements.txtfür MkDocs und API (sieheCHANGELOG.mdim Repo-Root).
Behoben
- Frontend-Tests: Der Iframe-Navigationstest für
DocsPanelwartet nach abgeschlossenem gemocktemfetchauf die Registrierung desmessage-Listeners und nutzt ein längereswaitFor-Timeout, damit die CI auf langsameren Runnern stabil bleibt. - Docs / CI:
pymdown-extensions>=10.21.2vermeidet einen Pygments-Absturz beim Site-Build (wieCHANGELOG.mdim Repo-Root). - Python / CI:
markdown>=3.6undmkdocs>=1.6inbackend/requirements.txt, damit pip den Docs-Stack mit pymdown 10.21.2+ auflösen kann (wieCHANGELOG.mdim Repo-Root).
0.0.10a - 2026-03-23
Behoben
- Backend-Abhängigkeiten: Eine einzige Datei
backend/requirements.txtfür API und In-App-MkDocs-Builds; doppeltebackend/requirements-docs.txtentfernt.
Geändert
- Dokumentationsnavigation: Wechsel von horizontalen Top-Tabs zu einer einzelnen linken Seitenleiste mit aufklappbarer Baumnavigation; jede Hauptkategorie (Startseite, Erste Schritte usw.) kann ein- oder ausgeklappt werden.
- Schlüsselfunktionen-Kacheln: Jede Funktionskachel auf der Dokumentations-Startseite ist jetzt ein klickbarer Link zu ihrer detaillierten Dokumentation (Seite Funktionen oder Formate).
- CONTRIBUTING.md: DCO-Signatur (Developer Certificate of Origin) für alle Commits hinzugefügt.
- Contributing-Dokumentation: Vollständige Übersetzungen für Deutsch (de), Spanisch (es) und Französisch (fr); alle Locales haben jetzt konsistenten, vollständigen Inhalt inklusive DCO-Anforderungen.
Sicherheit
- Rollup Path-Traversal (GHSA-mw96-cpmx-2vgc) und Minimatch ReDoS (GHSA-3ppc-4f35-3m26) per npm-Overrides im Frontend behoben:
rollup >=4.59.0,minimatch 9.0.6für@typescript-eslint/typescript-estree. - Werkzeug safe_join für Windows-Gerätenamen in mehrsegmentigen Pfaden behoben (CVE-2026-27199, GHSA-29vq-49wr-vm6x): werkzeug 3.1.4 → 3.1.6.
- Flask-Session Vary: Cookie-Header bei Verwendung des
in-Operators behoben (CVE-2026-27205): flask 3.0.0 → 3.1.3. - SSRF-Prävention: URL-Validierung vor ausgehenden Anfragen in
download_from_url,download_from_url_with_imagesunddownload_image; blockiert Loopback, private IPs, Link-Local, Metadata und gefährliche Schemas. - CodeQL-Sicherheitsfixes:
- SSRF:
validate_url_safe_for_requestgibt jetzt die validierte URL zurück; allerequests.get-Aufrufe verwenden den Rückgabewert zur Erfüllung der Datenflussanalyse. - ReDoS: HTML-Bildextraktion vor Regex-Verarbeitung auf 5 MB begrenzt, um polynomielle Regex auf benutzerkontrolliertem Inhalt zu mindern.
- Path-Traversal:
delete_output_folderverwendet jetztvalidate_job_idundget_validated_output_diraus den Sicherheits-Utilities statt manueller Prüfungen. - Informationsoffenlegung: Einstellungs-API-Fehlerantworten werden über
_sanitize_error_for_clientbereinigt, um Stack-Trace- oder sensible Datenlecks zu verhindern.
0.0.10a - 2026-02-24
Hinzugefügt
- Docker-Image-Publishing-Workflow: GitHub Action läuft bei PR-Merges in
main, baut Multi-Platform-Images und pusht zu Docker Hub und GitHub Container Registry (benötigtDOCKERHUB_USERNAME- undDOCKERHUB_TOKEN-Secrets). - Chunks jetzt generieren: Button im RAG-Chunks-Tab zur bedarfsgesteuerten Chunk-Generierung für abgeschlossene Dokumente (
POST /api/history/{job_id}/generate-chunks) - Inhaltsadressierte Deduplizierung: Gleiche Datei + gleiche dokumentbeeinflussende Einstellungen nutzen gespeicherten Inhalt statt Neu-Konvertierung
- Cache-Treffer: Symlink erstellen, Metadaten laden, sofort abschließen (kein Docling-Lauf)
- Cache-Fehler: Konvertierung ausführen, Ausgabe in Content-Store verschieben, Symlink erstellen
- Datenbank-Migration
scripts/migrate_add_content_hash.pyfügt Spaltecontent_hashhinzu - Konvertierungsstatistiken und -metriken: Erweiterte History-Statistiken für Docling- und Duckling-Nutzungsanalysen
GET /api/history/statsliefertavg_processing_seconds,ocr_backend_breakdown,output_format_breakdown,performance_device_breakdown,chunking_enabled_count,error_category_breakdown,source_type_breakdownundqueue_depth- Datenbank-Migration
scripts/migrate_add_stats_columns.pyfügt Stats-Spalten zur conversions-Tabelle hinzu - History-Panel zeigt durchschnittliche Verarbeitungszeit und Warteschlangentiefe, wenn verfügbar
- Statistik-Panel: Dedizierter Viewer für Konvertierungsstatistiken (Header-Button, „Vollständige Statistiken anzeigen“ aus History)
- Erweiterte Statistiken: Hardware- und Leistungsmetriken im Statistik-Panel
- System-Abschnitt: Hardware-Typ (CPU/CUDA/MPS), CPU-Anzahl, aktuelle CPU-Auslastung, GPU-Infos
- Durchschnittliche Seiten/Sek und Seiten/Sek pro CPU
- Konvertierungszeitverteilung (Median, 95., 99. Perzentil)
- Seiten/Sek-Diagramm über Zeit
- CPU-Auslastung während jeder Konvertierung gemittelt (in DB gespeichert)
- Datenbank-Migration
scripts/migrate_add_cpu_usage_column.pyfügt Spaltecpu_usage_avg_during_conversionhinzu - CPU-Auslastung ist jetzt prozessspezifisch (Duckling-Backend-Prozess, führt Docling aus), nicht systemweit
- Pro-Konvertierung-Konfiguration gespeichert:
performance_device_used(von „auto“ bei Abschluss aufgelöst),images_classify_enabled - Datenbank-Migration
scripts/migrate_add_config_columns.pyfügt diese Spalten hinzu - Stats-Aufschlüsselung nach Hardware, OCR-Backend, Bildklassifikator (Seiten/Sek, Konvertierungszeit pro Konfiguration)
- UI-Sprachunterstützung (Englisch
en, Spanisches, Französischfr, Deutschde) mit Sprachumschalter. - Mehrsprachige MkDocs-Dokumentation (Englisch, Spanisch, Französisch, Deutsch) unter
/api/docs/site/<locale>/. - Dropzone-Panel-Kategoriebeschriftungen (Dokumente, Web, Bilder, Daten) jetzt vollständig internationalisiert.
- Docling-Docs-Abschnitt in MkDocs (kuratierte, vendored Teilmenge der Upstream-Docling-Dokumentation + Sync-Skript).
- Sitzungsbasierte Benutzereinstellungen: Benutzereinstellungen pro Sitzung in der Datenbank statt in einer gemeinsamen Datei gespeichert.
Sicherheit
- Frontend-Sicherheitslücken behoben (esbuild GHSA-67mh-4wv8-2f99): Vite 5→7, Vitest 1→4 und zugehörige Abhängigkeiten aktualisiert.
Geändert
- Backend-Einstiegspunkt von
app.pyzuduckling.pyumbenannt für bessere Klarheit. - Flask-Anwendungsname zu „duckling“ geändert (zeigt „Serving Flask app 'duckling'“).
Behoben
- Die Dokumentationsnavigation zeigt jetzt vollständig lokalisierte Seitennamen in allen unterstützten Sprachen an.
- Kategoriebeschriftungen für Dateiformate im Dropzone-Panel werden jetzt korrekt basierend auf der ausgewählten Sprache übersetzt.
- Verbesserte Extraktion von Dokumentationsseitentiteln mit besserem Fallback auf übersetzte Namen.
- Prev/Next-Links in der Fußzeile des eingebetteten Docs-Panels bleiben innerhalb der aktuellen Seitenleisten-Kategorie, und die Navigation innerhalb der eingebetteten Docs hält die Seitenleisten-Auswahl synchron.
- Fehlgeschlagener Docs-Rebuild der eingebetteten App mit
cannot access local variable 'shutil'beim MkDocs-Site-Build behoben. - Backend-Docs-Rebuild bevorzugt jetzt die repo-lokale
./venvMkDocs-Umgebung, um erforderliche Plugins (wiei18n) sicherzustellen. - Behoben: Klick auf History-Eintrag lud Dokument nicht; verwendet jetzt den History-Load-Endpoint (Festplatte) statt des In-Memory-Ergebnis-Endpoints.
- Wenn
document_json_pathin der DB fehlt, findet und lädt History-Load jetzt*.document.jsonaus dem Ausgabeverzeichnis, sodass alle History-Einträge geladen werden, nicht nur der erste. - Dokumentenansichts-Panel aktualisiert sich jetzt beim Laden eines anderen History-Eintrags (verwendet Komponenten-Key zum Remount mit frischem Zustand).
vitest.config.tsfür Vitest-4-Kompatibilität aktualisiert.- CI/CD Node.js-Versionsanforderung auf 22 aktualisiert (erforderlich für Vite 7).
0.0.9 - 2026-01-08
Hinzugefügt
- Custom Branding: Duckling-Logo und Versionsanzeige in der Kopfzeile.
- URL-basierte Dokumentenkonvertierung: Konvertierung von URLs mit automatischer Bildextraktion für HTML.
- Dokumentenanreicherungsoptionen: Code-, Formel-, Bildklassifizierung und Bildbeschreibung.
- Enrichment-Modell-Vorab-Download: KI-Modelle vor der Verarbeitung herunterladen.
- Bildvorschau-Galerie: Visuelle Miniaturansichten mit Lightbox-Viewer.
- OCR-Backend-Auto-Installation: Ein-Klick-Installation für pip-installierbare Backends.
- Format-spezifische Vorschau: Vorschau-Panel zeigt Inhalt im gewählten Exportformat.
- Gerendert vs. Roh-Vorschau-Modus: Umschalter für HTML und Markdown.
- Erweiterte Docker-Unterstützung: Multi-Stage-Dockerfiles, docker-compose-Varianten, Multi-Platform-Builds.
Behoben
- Multi-Worker-Inhaltsabruf (Bilder, Tabellen, Ergebnisse).
- HTML-Vorschau in der UI.
- URL-Bildextraktion für nicht in Anführungszeichen gesetzte
src-Attribute. - Dokumentations-Panel bedient jetzt vorgefertigte MkDocs-Site.
- Umgebungsvariablen und
.env-Laden. - Groß-/kleinschreibungsunabhängige Dateiendungen.
- Konfidenz-Score und OCR-Backend-Auswahl.
0.0.8 - 2026-01-07
Geändert
- Umbenannt: Projekt von „Docling UI“ zu „Duckling“ umbenannt
- Alle Dokumentation, Code und Konfigurationsdateien aktualisiert
- Branding in der gesamten Anwendung aktualisiert
0.0.7 - 2026-01-07
Hinzugefügt
- MkDocs-Dokumentation: Dokumentation zu MkDocs mit Material-Theme migriert
- Moderne, durchsuchbare Dokumentationsseite
- Dunkel-/Hell-Theme-Umschalter
- Mermaid-Diagramm-Unterstützung
- Verbesserte Navigation und Organisation
Geändert
- Dokumentationsstruktur für bessere Navigation reorganisiert
- Alle Diagramme in Mermaid-Format für Live-Rendering konvertiert
0.0.6 - 2025-12-11
Sicherheit
- KRITISCH: Flask-Debug-Modus standardmäßig in Produktion aktiviert – behoben
- Debug-Modus wird jetzt durch Umgebungsvariable
FLASK_DEBUGgesteuert (Standard: false) - Host-Binding standardmäßig
127.0.0.1statt0.0.0.0 - HOCH: Anfällige Abhängigkeiten aktualisiert
flask-cors: 4.0.0 → 6.0.0 (CVE-2024-1681, CVE-2024-6844, CVE-2024-6866, CVE-2024-6839)gunicorn: 21.2.0 → 23.0.0 (CVE-2024-1135, CVE-2024-6827)werkzeug: 3.0.1 → 3.1.4 (CVE-2024-34069, CVE-2024-49766, CVE-2024-49767, CVE-2025-66221)- MITTEL: Path-Traversal-Schutz für Datei-Serving-Endpoints hinzugefügt
- Bild-Serving validiert, dass Pfade erlaubte Verzeichnisse nicht verlassen
- Blockiert Verzeichnis-Traversal-Sequenzen (
..) - MITTEL: Erweiterte SQL-Abfrage-Sanitisierung
- Suchabfragen escapen jetzt LIKE-Wildcards
- Abfragelängenlimits hinzugefügt
- Umfassendes
SECURITY.mdhinzugefügt mit: - Sicherheitsaudit-Zusammenfassung
- Produktions-Deployment-Checkliste
- Umgebungsvariablen-Dokumentation
- Richtlinien zur Meldung von Schwachstellen
Geändert
- Backend verwendet jetzt Umgebungsvariablen für alle sicherheitsrelevanten Konfigurationen
- Standard-Host von
0.0.0.0auf127.0.0.1für sicherere Defaults geändert
0.0.5 - 2025-12-10
Hinzugefügt
- Stapelverarbeitung: Mehrere Dateien gleichzeitig hochladen und konvertieren
- Stapelmodus im Header umschalten
-
Mehrere Dokumente gleichzeitig verarbeiten
-
Bild- und Tabellenextraktion:
- Eingebettete Bilder aus Dokumenten extrahieren
- Einzelne Bilder herunterladen
- Tabellen mit vollständiger Datenerhaltung extrahieren
- Tabellen als CSV exportieren
-
Tabellenvorschauen in der UI anzeigen
-
RAG/Chunking-Unterstützung:
- Dokumenten-Chunking für RAG-Anwendungen
- Konfigurierbare max. Tokens pro Chunk (64-8192)
- Merge-Peers-Option für unterdimensionierte Chunks
-
Chunks als JSON herunterladen
-
Zusätzliche Exportformate:
- Dokument-Tokens (
.tokens.json) - RAG-Chunks (
.chunks.json) -
Erweiterter DocTags-Export
-
Erweiterte OCR-Optionen:
- Mehrere OCR-Backends: EasyOCR, Tesseract, macOS Vision, RapidOCR
- GPU-Beschleunigungsunterstützung (EasyOCR)
- Konfigurierbarer Konfidenzschwellenwert (0-1)
- Bitmap-Bereichsschwellenwert-Steuerung
-
Unterstützung für 28+ Sprachen
-
Tabellenstruktur-Optionen:
- Schnell vs. Präzise Erkennungsmodi
- Zellabgleich-Konfiguration
-
Strukturextraktions-Umschalter
-
Bildgenerierungs-Optionen:
- Seitenbilder generieren
- Bildbilder extrahieren
- Tabellenbilder extrahieren
-
Konfigurierbare Bildskalierung (0.1x - 4.0x)
-
Performance/Akzelerator-Optionen:
- Geräteauswahl: Auto, CPU, CUDA, MPS (Apple Silicon)
- Thread-Anzahl-Konfiguration (1-32)
-
Dokument-Timeout-Einstellung
-
Neue API-Endpoints:
POST /api/convert/batch- StapelkonvertierungGET /api/convert/<job_id>/images- Extrahierte Bilder auflistenGET /api/convert/<job_id>/images/<id>- Bild herunterladenGET /api/convert/<job_id>/tables- Extrahierte Tabellen auflistenGET /api/convert/<job_id>/tables/<id>/csv- Tabellen-CSV herunterladenGET /api/convert/<job_id>/tables/<id>/image- Tabellenbild herunterladenGET /api/convert/<job_id>/chunks- Dokument-Chunks abrufenGET/PUT /api/settings/performance- Performance-EinstellungenGET/PUT /api/settings/chunking- Chunking-EinstellungenGET /api/settings/formats- Alle unterstützten Formate auflisten
Geändert
- Einstellungs-Panel: Vollständig neu gestaltet mit allen neuen Optionen
- Export-Optionen: Mit Tabs für verschiedene Inhaltstypen erweitert
- DropZone: Mit Formatkategorien und Stapelmodus-Unterstützung aktualisiert
- Converter-Service: Große Refaktorierung für dynamische Pipeline-Optionen
Behoben
- Konfidenz-Score-Berechnung verwendet jetzt Cluster-Level-Vorhersagen
- Bessere Handhabung von teilweisem Konvertierungserfolg
0.0.4 - 2025-12-10
Hinzugefügt
- OCR-Unterstützung: Vollständige OCR-Integration mit EasyOCR
- Unterstützung für 14+ Sprachen
- Option „Force Full Page OCR“
- Konfigurierbare OCR-Einstellungen
- Verbesserte Konfidenzberechnung: Durchschnittliche Konfidenz aus Layout-Vorhersagen
Geändert
- Converter-Service für konfigurierbare Pipeline-Optionen aktualisiert
- Einstellungs-Panel mit OCR-Optionen erweitert
0.0.3 - 2025-12-10
Hinzugefügt
- Erste Veröffentlichung von Duckling
- Frontend-Funktionen:
- Drag-and-Drop-Datei-Upload
- Echtzeit-Konvertierungsfortschritt
- Multi-Format-Export-Optionen
- Einstellungs-Panel
- Konvertierungs-History-Panel
- Dunkles Theme mit Türkis-Akzent
- Responsives Design
-
Animierte Übergänge
-
Backend-Funktionen:
- Flask-REST-API mit CORS
- Asynchrone Dokumentenkonvertierung
- SQLite-basierte History
- Datei-Upload-Verwaltung
- Konfigurierbare Einstellungen
-
Health-Check-Endpoint
-
Unterstützte Eingabeformate:
- PDF, Word, PowerPoint, Excel
- HTML, Markdown, CSV
- Bilder (PNG, JPG, TIFF usw.)
-
AsciiDoc, XML
-
Exportformate:
- Markdown, HTML, JSON
-
DocTags, Plain Text
-
Developer Experience:
- Umfassende Test-Suites
- Docker-Unterstützung
- TypeScript
- ESLint-Konfiguration
Sicherheit
- Eingabevalidierung für Datei-Uploads
- Dateityp-Einschränkungen
- Maximale Dateigrößenlimits
- Sichere Dateinamenbehandlung