Fonctionnalités

Duckling propose un ensemble complet de fonctionnalités pour la conversion de documents.

Téléversement de documents

Glisser-déposer

Glissez-déposez des fichiers sur la zone de dépôt pour un téléversement immédiat. L’interface valide les types de fichiers et affiche la progression du téléversement.

Zone de dépôt vide — Zone de dépôt prête à recevoir des fichiers

Saisie par URL

Convertissez des documents directement à partir d’URL, sans les télécharger au préalable :

Cliquez sur l’onglet URLs au-dessus de la zone de dépôt
Collez une URL par ligne (une ligne = un document ; plusieurs lignes = traitement par lot)
Cliquez sur Tout convertir
Les documents sont téléchargés et convertis automatiquement

Fonctionnalités des URL :

Détection automatique du type de fichier à partir du chemin de l’URL
Détection via l’en-tête Content-Type pour les fichiers sans extension
Prise en charge de l’en-tête Content-Disposition pour le nom de fichier
Mêmes restrictions de type que pour les téléversements locaux
Extraction automatique des images pour les pages HTML : lors de la conversion de HTML depuis une URL, Duckling télécharge toutes les images référencées dans la page et les rend disponibles dans la galerie d’aperçu des images

Pages HTML avec images

Lorsque vous convertissez une page HTML (article de blog, etc.), Duckling :

Télécharge le contenu HTML
Repère toutes les balises <img> et les images d’arrière-plan CSS
Télécharge chaque image depuis son URL
Intègre les images en URI de données base64 dans le HTML
Enregistre les images séparément pour l’aperçu et le téléchargement

Les documents HTML convertis conservent ainsi toutes leurs images, même hors ligne.

Liens directs

Utilisez des liens de téléchargement directs, pas des URL de pages web génériques. Par exemple :

✅ https://example.com/document.pdf
✅ https://example.com/blog/article (les pages HTML fonctionnent aussi)
❌ https://example.com/view/document (le contenu rendu en JavaScript peut ne pas fonctionner)

Plusieurs fichiers et dossiers

Téléversez et convertissez plusieurs fichiers (ou tout un dossier) depuis la même zone, sans activer un mode séparé :

Glissez-déposez des fichiers, choisissez un dossier ou utilisez Choisir des fichiers…
Passez à l’onglet URLs et collez une URL par ligne pour le web
Suivez la progression (un seul traitement : vue habituelle ; plusieurs : résumé multi-fichiers)
Téléchargez les résultats séparément ou ensemble à la fin du lot

Plusieurs URLs

Le champ URL est toujours une zone de texte multiligne :

Passez à l’onglet URLs
Collez une URL par ligne
Cliquez sur Tout convertir

Traitement concurrent

La file d’attente traite jusqu’à 2 documents en parallèle pour limiter l’usage mémoire.

OCR (reconnaissance optique de caractères)

Extrayez le texte des documents numérisés et des images.

Moteurs pris en charge

Moteur	Description	GPU	Idéal pour
EasyOCR	Multilingue, précis	Oui (CUDA)	Documents complexes
Tesseract	Classique, fiable	Non	Documents simples
macOS Vision	OCR Apple natif	Apple Neural Engine	Utilisateurs Mac
RapidOCR	Rapide, léger	Non	Débit prioritaire

Installation automatique des moteurs

Duckling peut installer automatiquement les moteurs OCR lorsque vous les sélectionnez :

Ouvrez le panneau Paramètres
Choisissez un moteur OCR dans la liste
S’il n’est pas installé, un bouton Installer apparaît
Cliquez pour lancer l’installation via pip

Prérequis d’installation

EasyOCR, OcrMac, RapidOCR : installation possible via pip
Tesseract : installation système requise au préalable :
macOS : brew install tesseract
Ubuntu/Debian : apt-get install tesseract-ocr
Windows : téléchargement depuis GitHub releases

Avis Tesseract — Tesseract nécessite une installation manuelle sur le système

Le panneau Paramètres indique l’état de chaque moteur :

✓ Installé et prêt — disponible pour la conversion
⚠ Non installé — cliquez pour installer (moteurs installables via pip)
ℹ Installation système requise — suivez les instructions manuelles

Langues prises en charge

Plus de 28 langues, notamment :

Europe : anglais, allemand, français, espagnol, italien, portugais, néerlandais, polonais, russe
Asie : japonais, chinois (simplifié/traditionnel), coréen, thaï, vietnamien
Moyen-Orient : arabe, hébreu, turc
Asie du Sud : hindi

Options OCR

Option	Description
Forcer l’OCR sur toute la page	Traiter toute la page plutôt que les zones détectées
Accélération GPU	Utiliser CUDA pour accélérer (EasyOCR)
Seuil de confiance	Confiance minimale des résultats (0 à 1)
Seuil de surface bitmap	Ratio de surface minimal pour l’OCR sur bitmap

Extraction des tableaux

Détectez et extrayez automatiquement les tableaux des documents.

Modes de détection

Mode précisMode rapide

Détection plus précise
Meilleure reconnaissance des limites des cellules
Traitement plus lent
Recommandé pour les tableaux complexes

Traitement plus rapide
Adapté aux tableaux simples
Structures complexes parfois manquées

Options d’export

CSV : télécharger chaque tableau au format CSV
Image : télécharger le tableau en PNG
JSON : structure complète du tableau dans la réponse API

Extraction des images

Extrayez les images intégrées des documents.

Options

Option	Description
Extraire les images	Activer l’extraction d’images
Classifier les images	Étiqueter les images (figure, illustration, etc.)
Générer des images de page	Créer une image par page
Générer des images d’illustrations	Extraire les illustrations en fichiers
Générer des images de tableaux	Extraire les tableaux sous forme d’images
Échelle des images	Facteur d’échelle de sortie (0,1x à 4,0x)

Galerie d’aperçu des images

Après conversion, les images extraites s’affichent dans une galerie :

Grille de miniatures : toutes les images en vignettes
Actions au survol : aperçu et téléchargement rapides
Visionneuse (lightbox) : clic pour voir en taille réelle
Navigation : flèches pour parcourir les images
Télécharger : téléchargement depuis la galerie ou la lightbox

Galerie d’images — Images extraites affichées en miniatures

Lightbox — Vue plein écran avec navigation

Formats d’image

Les images extraites sont enregistrées en PNG pour une compatibilité maximale.

Enrichissement des documents

Enrichissez vos documents convertis avec des fonctions avancées assistées par l’IA.

Enrichissements disponibles

Fonctionnalité	Description	Impact
Enrichissement du code	Détection des langages et blocs de code améliorés	Faible
Enrichissement des formules	Extraction LaTeX des équations	Moyen
Classification d’images	Types sémantiques (figure, graphique, schéma, photo)	Faible
Description d’images	Légendes générées par IA	Élevé

Configuration

Activez les enrichissements dans Paramètres, section Enrichissement des documents :

Ouvrez Paramètres (icône d’engrenage)
Faites défiler jusqu’à Enrichissement des documents
Activez ou désactivez les options souhaitées
Les paramètres sont enregistrés automatiquement

Paramètres d’enrichissement — Panneau d’enrichissement des documents

Durée de traitement

Les enrichissements, surtout Description d’images et Enrichissement des formules, allongent notablement le traitement (inférence de modèles). Un avertissement s’affiche lorsqu’ils sont activés.

Avertissement enrichissement — Avertissement lorsque des options lentes sont activées

Enrichissement du code

Lorsqu’il est activé, les blocs de code sont enrichis avec :

Détection automatique du langage
Métadonnées pour la coloration syntaxique
Meilleure reconnaissance de la structure

Enrichissement des formules

Extrait les formules mathématiques et les convertit en LaTeX :

Équations en ligne : $E = mc^2$
Équations affichées avec mise en forme
Meilleur rendu en export HTML et Markdown

Classification d’images

Étiquette les images par type :

Figure : schémas, illustrations
Graphique : histogrammes, courbes, secteurs
Photo : photographies, captures d’écran
Logo : logos, icônes
Tableau : images de tableaux (distinct de l’extraction de tableaux)

Description d’images

Utilise des modèles vision-langage pour générer des légendes :

Descriptions en langage naturel
Utile pour l’accessibilité (texte alternatif)
Améliore la recherche dans le document
Téléchargement du modèle au premier usage

Modèles requis

La description d’images nécessite un modèle vision-langage (~1 à 2 Go), téléchargé automatiquement au premier usage (plusieurs minutes possibles).

Prétéléchargement des modèles

Pour éviter les attentes pendant la conversion, vous pouvez prétélécharger les modèles :

Ouvrez Paramètres
Allez à Enrichissement des documents
En bas, zone Prétélécharger les modèles
Cliquez sur Télécharger à côté du modèle souhaité

Modèle	Taille	Rôle
Classificateur d’images	~350 Mo	Type d’image
Descripteur d’images	~2 Go	Légendes IA
Reconnaisseur de formules	~500 Mo	Extraction LaTeX
Détecteur de code	~200 Mo	Langage de programmation

Progression du téléchargement

Une barre de progression indique l’état. Les modèles sont mis en cache localement ; un seul téléchargement suffit.

Découpage pour RAG

Générez des segments de document adaptés à la génération augmentée par récupération (RAG).

Fonctionnement

Le document est découpé en segments sémantiques
Chaque segment respecte la structure du document
Les segments incluent des métadonnées (titres, numéros de page)
Les segments trop petits peuvent être fusionnés

Configuration

Paramètre	Description	Par défaut
Jetons max.	Nombre maximal de jetons par segment	512
Fusion des pairs	Fusionner les petits segments	true

Format de sortie

{
  "chunks": [
    {
      "id": 1,
      "text": "Introduction to machine learning...",
      "meta": {
        "headings": ["Chapter 1", "Introduction"],
        "page": 1
      }
    }
  ]
}

Formats d’export

Formats disponibles

Format	Extension	Description
Markdown	`.md`	Texte structuré (titres, listes, liens)
HTML	`.html`	Prêt pour le Web avec styles
JSON	`.json`	Structure complète du document (sans perte)
Texte brut	`.txt`	Texte simple
DocTags	`.doctags`	Format balisé
Jetons de document	`.tokens.json`	Représentation au niveau des jetons
Segments RAG	`.chunks.json`	Segments pour applications RAG

Aperçu

Le panneau d’export affiche un aperçu en direct qui se met à jour selon le format choisi.

Aperçu par format

Contenu dynamique : chargement selon le format sélectionné
Badge de format : format actuellement affiché
Mise en cache : bascule instantanée entre formats déjà chargés

Mode rendu ou brut

Pour HTML et Markdown, basculez entre vue rendue et code source :

Basculer l’aperçu — Basculer entre aperçu rendu et brut

Mode renduMode brut

HTML : mise en forme, tableaux, liens
Markdown : titres, gras/italique, blocs de code, liens
Idéal pour vérifier le rendu visuel

Markdown rendu

Affiche le code source
HTML : balises et attributs bruts
Markdown : syntaxe (#, **gras**, etc.)
Utile pour copier le contenu ou déboguer la mise en forme

Markdown brut

Autres formats

JSON : pretty-print avec indentation
Texte brut : affichage tel quel
DocTags / jetons : affichage brut

Historique des conversions

Accédez aux documents déjà convertis :

État de la conversion et métadonnées
Retéléchargement des fichiers convertis
Recherche par nom de fichier
Statistiques de conversion

Fonctionnalités de l’historique

Recherche : par nom de fichier
Filtrage : par état (terminé, échoué)
Export : historique au format JSON
Recharger un document : cliquez une entrée terminée pour rouvrir le résultat sans reconvertir
Les documents sont stockés sur disque après conversion
La structure complète est conservée ; rechargement instantané
Déduplication : même fichier et mêmes paramètres réutilisent la sortie stockée
Générer les segments maintenant : si aucun segment RAG n’existe, génération à la demande avec les paramètres de découpage actuels (sans reconversion)
Les conversions avec contenu et paramètres identiques (OCR, tableaux, images) peuvent être servies depuis le cache
Les sorties sont stockées une fois et partagées (liens symboliques)

Panneau des statistiques

Panneau latéral dédié aux analyses de conversion. Ouvrez-le via le bouton Statistiques dans l’en-tête ou le lien Voir les statistiques complètes dans l’historique.

Vue d’ensemble

Nombre total de conversions, réussites/échecs, taux de réussite
Temps de traitement moyen et profondeur de file

Stockage

Téléversements, sorties et stockage total

Répartitions

Formats d’entrée, moteurs OCR, formats de sortie
Matériel (CPU/CUDA/MPS), types de source
Catégories d’erreurs
Nombre de conversions avec découpage RAG

Métriques étendues

Système : type de matériel (CPU/CUDA/MPS), nombre de cœurs, utilisation CPU du backend Duckling, informations GPU
Débit : pages/s moyen et pages/s par cœur CPU
Distribution des durées : médiane, 95e et 99e percentiles
Pages/s dans le temps : graphique du débit sur l’historique
Performances par configuration : pages/s et durée selon matériel, moteur OCR et classificateur d’images