Démarrage rapide
Démarrez avec Duckling en 5 minutes.
Lancer l’application
Choisissez votre méthode préférée :
Le moyen le plus rapide pour commencer — aucune dépendance à installer !
Option 1 : Images préconstruites (la plus rapide)
# Télécharger le fichier compose
curl -O https://raw.githubusercontent.com/davidgs/duckling/main/docker-compose.prebuilt.yml
# Démarrer Duckling
docker-compose -f docker-compose.prebuilt.yml up -d
Option 2 : Construire localement
# Cloner le dépôt et démarrer
git clone https://github.com/davidgs/duckling.git
cd duckling
docker-compose up --build
L’interface est disponible sur http://localhost:3000
Premier lancement
Le premier démarrage peut prendre quelques minutes pendant que Docker télécharge ou construit les images.
Votre première conversion
1. Ouvrir l’application
Ouvrez http://localhost:3000 dans votre navigateur.
2. Téléverser un document
Glissez-déposez un PDF, un document Word ou une image dans la zone de dépôt, ou cliquez pour parcourir.
3. Suivre la progression
La progression de la conversion s’affiche en temps réel.
4. Télécharger les résultats
Une fois terminé, choisissez votre format d’export :
- Markdown – Idéal pour la documentation
- HTML – Sortie prête pour le web
- JSON – Structure complète du document
- Texte brut – Extraction de texte simple
Configuration de base
Cliquez sur le bouton Paramètres pour configurer :
Paramètres OCR
| Paramètre | Par défaut | Description |
|---|---|---|
| Activé | true | Activer l’OCR pour les documents numérisés |
| Moteur | easyocr | Moteur OCR à utiliser |
| Langue | en | Langue principale |
Paramètres des tableaux
| Paramètre | Par défaut | Description |
|---|---|---|
| Activé | true | Extraire les tableaux des documents |
| Mode | accurate | Niveau de précision de détection |
Paramètres des images
| Paramètre | Par défaut | Description |
|---|---|---|
| Extraire | true | Extraire les images intégrées |
| Échelle | 1.0 | Échelle de sortie des images |
Traitement par lots
Pour convertir plusieurs fichiers à la fois :
- Glissez-déposez plusieurs fichiers ou un dossier entier dans la zone de dépôt. Le navigateur développe un dossier en liste de fichiers ; Duckling met en file chaque document pris en charge (les types non pris en charge sont ignorés).
- Cliquez sur la zone de dépôt pour ouvrir un sélecteur de dossier et téléverser d’un coup tous les fichiers pris en charge qu’il contient.
- Utilisez Choisir des fichiers… lorsque vous voulez sélectionner uniquement des fichiers (pas le mode dossier).
Tous les fichiers en file sont traités selon la file d’attente des tâches (voir Fonctionnalités pour les limites de concurrence).
Performances
Le traitement par lots utilise une file d’attente avec au plus 2 conversions simultanées pour éviter l’épuisement de la mémoire.
Utiliser l’API
Pour un accès programmatique, utilisez l’API REST :
# Téléverser et convertir un document
curl -X POST http://localhost:5001/api/convert \
-F "file=@document.pdf"
# Réponse
{
"job_id": "550e8400-e29b-41d4-a716-446655440000",
"status": "processing"
}
Consultez la référence API pour la documentation complète.
Étapes suivantes
- Fonctionnalités – Explorer toutes les capacités
- Configuration – Paramètres avancés
- Référence API – Intégrer à vos applications