Web Analytics Made Easy - Statcounter
Skip to content

Duckling

Una interfaz gr谩fica moderna y f谩cil de usar para Docling - la potente biblioteca de conversi贸n de documentos de IBM.

Captura de Duckling

Resumen

Duckling proporciona una interfaz web intuitiva para convertir documentos usando la biblioteca Docling de IBM. Ya sea que necesites extraer texto de PDFs, convertir documentos Word a Markdown o realizar OCR en im谩genes escaneadas, Duckling lo hace sencillo.

Caracter铆sticas principales

Inicio r谩pido

Comienza en minutos:

Inicio con un comando usando im谩genes preconstruidas:

curl -O https://raw.githubusercontent.com/davidgs/duckling/main/docker-compose.prebuilt.yml && docker-compose -f docker-compose.prebuilt.yml up -d

O construir localmente:

git clone https://github.com/davidgs/duckling.git
cd duckling
docker-compose up --build

# Clonar el repositorio
git clone https://github.com/davidgs/duckling.git
cd duckling

# Configuraci贸n del backend
cd backend
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
python duckling.py

# Configuraci贸n del frontend (nueva terminal)
cd frontend
npm install
npm run dev

Accede a la aplicaci贸n en http://localhost:3000

Formatos soportados

Formatos de entrada

Formato Extensiones Descripci贸n
PDF .pdf Formato de documento port谩til
Word .docx Documentos de Microsoft Word
PowerPoint .pptx Presentaciones de Microsoft PowerPoint
Excel .xlsx Hojas de c谩lculo de Microsoft Excel
HTML .html, .htm P谩ginas web
Markdown .md, .markdown Archivos Markdown
Im谩genes .png, .jpg, .jpeg, .tiff, .gif, .webp, .bmp OCR directo de im谩genes
AsciiDoc .asciidoc, .adoc Documentaci贸n t茅cnica
PubMed XML .xml Art铆culos cient铆ficos
USPTO XML .xml Documentos de patentes

Formatos de exportaci贸n

Formato Extensi贸n Descripci贸n
Markdown .md Texto formateado con encabezados, listas, enlaces
HTML .html Formato listo para web con estilos
JSON .json Estructura completa del documento
Texto plano .txt Texto simple sin formato
DocTags .doctags Formato de documento etiquetado
Document Tokens .tokens.json Representaci贸n a nivel de tokens
RAG Chunks .chunks.json Fragmentos para aplicaciones RAG

Arquitectura

graph LR
    A[Navegador] --> B[Frontend React]
    B --> C[Backend Flask]
    C --> D[Motor Docling]
    D --> E[(Almacenamiento)]

    style A fill:#3b82f6,color:#fff
    style B fill:#1e3a5f,color:#fff
    style C fill:#14b8a6,color:#fff
    style D fill:#8b5cf6,color:#fff
    style E fill:#f59e0b,color:#fff

Documentaci贸n

Agradecimientos