Características

Duckling ofrece un conjunto completo de funciones para la conversión de documentos.

Carga de documentos

Arrastrar y soltar

Arrastra archivos a la zona de entrega para subirlos al instante. La interfaz valida los tipos de archivo y muestra el progreso de la subida.

Zona de entrega vacía — Zona de entrega lista para recibir archivos

Entrada por URL

Convierte documentos directamente desde URL sin descargarlos antes a mano:

Haz clic en la pestaña URLs encima de la zona de entrega
Pega una URL por línea (una línea = un documento; varias líneas = procesamiento por lotes)
Haz clic en Convertir todo
Los documentos se descargan y convierten automáticamente

Funciones de URL:

Detección automática del tipo de archivo desde la ruta de la URL
Detección mediante la cabecera Content-Type si no hay extensión
Soporte de Content-Disposition para el nombre de archivo
Las mismas restricciones de tipo que en subidas locales
Extracción automática de imágenes en HTML: al convertir HTML desde URL, Duckling descarga todas las imágenes referenciadas y las deja disponibles en la galería de vista previa

Páginas HTML con imágenes

Al convertir una página HTML (por ejemplo un artículo de blog), Duckling:

Descarga el HTML
Localiza todas las etiquetas <img> e imágenes de fondo CSS
Descarga cada imagen desde su URL
Incrusta las imágenes como URI de datos en base64 en el HTML
Guarda las imágenes por separado para vista previa y descarga

Así los HTML convertidos conservan todas sus imágenes, incluso sin conexión.

Enlaces directos

Usa enlaces de descarga directos, no URL genéricas de página. Por ejemplo:

✅ https://example.com/document.pdf
✅ https://example.com/blog/article (las páginas HTML también funcionan)
❌ https://example.com/view/document (el contenido con JavaScript puede fallar)

Varios archivos y carpetas

Sube y convierte varios archivos (o una carpeta entera) desde la misma zona, sin modo aparte:

Arrastra archivos, elige carpeta o usa Elegir archivos…
Cambia a la pestaña URLs y pega una URL por línea
Sigue el progreso (un trabajo: vista habitual; varios: resumen multiarchivo)
Descarga los resultados por separado o juntos al terminar el lote

Varias URLs

El campo URL es siempre un área de texto multilínea:

Cambia a la pestaña URLs
Pega una URL por línea
Haz clic en Convertir todo

Procesamiento concurrente

La cola procesa hasta 2 documentos a la vez para limitar el uso de memoria.

OCR (reconocimiento óptico de caracteres)

Extrae texto de documentos escaneados e imágenes.

Motores admitidos

Motor	Descripción	GPU	Ideal para
EasyOCR	Multilingüe, preciso	Sí (CUDA)	Documentos complejos
Tesseract	Clásico, fiable	No	Documentos simples
macOS Vision	OCR nativo de Apple	Apple Neural Engine	Usuarios de Mac
RapidOCR	Rápido, ligero	No	Alto rendimiento

Instalación automática de motores

Duckling puede instalar motores OCR al seleccionarlos:

Abre el panel Configuración
Elige un motor OCR en la lista
Si no está instalado, aparece Instalar
Haz clic para instalar con pip

Requisitos de instalación

EasyOCR, OcrMac, RapidOCR: se pueden instalar con pip
Tesseract: requiere instalación a nivel de sistema:
macOS: brew install tesseract
Ubuntu/Debian: apt-get install tesseract-ocr
Windows: descarga desde GitHub releases

Aviso Tesseract — Tesseract requiere instalación manual en el sistema

El panel Configuración muestra el estado de cada motor:

✓ Instalado y listo — disponible para convertir
⚠ No instalado — haz clic para instalar (motores instalables con pip)
ℹ Requiere instalación del sistema — sigue las instrucciones manuales

Idiomas admitidos

Más de 28 idiomas, entre ellos:

Europa: inglés, alemán, francés, español, italiano, portugués, neerlandés, polaco, ruso
Asia: japonés, chino (simplificado/tradicional), coreano, tailandés, vietnamita
Oriente Medio: árabe, hebreo, turco
Sur de Asia: hindi

Opciones de OCR

Opción	Descripción
Forzar OCR en toda la página	Procesar la página completa frente a regiones detectadas
Aceleración por GPU	Usar CUDA para ir más rápido (EasyOCR)
Umbral de confianza	Confianza mínima de los resultados (0–1)
Umbral de área de mapa de bits	Ratio mínimo de área para OCR en mapas de bits

Extracción de tablas

Detecta y extrae tablas de los documentos automáticamente.

Modos de detección

Modo precisoModo rápido

Detección más precisa
Mejor reconocimiento de límites de celdas
Procesamiento más lento
Recomendado para tablas complejas

Procesamiento más rápido
Adecuado para tablas simples
Puede omitir estructuras complejas

Opciones de exportación

CSV: descarga cada tabla como CSV
Imagen: descarga la tabla como PNG
JSON: estructura completa en la respuesta de la API

Extracción de imágenes

Extrae imágenes incrustadas de los documentos.

Opciones

Opción	Descripción
Extraer imágenes	Activar extracción
Clasificar imágenes	Etiquetar imágenes (figura, ilustración, etc.)
Generar imágenes de página	Una imagen por página
Generar imágenes de ilustraciones	Extraer ilustraciones como archivos
Generar imágenes de tablas	Extraer tablas como imágenes
Escala de imagen	Factor de escala de salida (0,1x a 4,0x)

Galería de vista previa de imágenes

Tras la conversión, las imágenes extraídas se muestran en una galería:

Cuadrícula de miniaturas: todas como vista previa
Acciones al pasar el cursor: acceso rápido a ver y descargar
Visor lightbox: clic para ver a tamaño completo
Navegación: flechas para recorrer imágenes
Descargar: desde la galería o la lightbox

Galería de imágenes — Imágenes extraídas en miniatura

Lightbox — Vista a pantalla completa con navegación

Formatos de imagen

Las imágenes extraídas se guardan en PNG para máxima compatibilidad.

Enriquecimiento de documentos

Enriquece los documentos convertidos con funciones avanzadas asistidas por IA.

Enriquecimientos disponibles

Función	Descripción	Impacto
Enriquecimiento de código	Detección de lenguajes y bloques de código mejorados	Bajo
Enriquecimiento de fórmulas	Extracción LaTeX de ecuaciones	Medio
Clasificación de imágenes	Tipos semánticos (figura, gráfico, esquema, foto)	Bajo
Descripción de imágenes	Leyendas generadas por IA	Alto

Configuración

Activa los enriquecimientos en Configuración, sección Enriquecimiento de documentos:

Abre Configuración (icono de engranaje)
Desplázate hasta Enriquecimiento de documentos
Activa o desactiva las opciones
Los ajustes se guardan automáticamente

Configuración de enriquecimiento — Panel de enriquecimiento de documentos

Tiempo de procesamiento

Los enriquecimientos, sobre todo Descripción de imágenes y Enriquecimiento de fórmulas, aumentan mucho el tiempo (inferencia de modelos). Se muestra una advertencia si están activos.

Advertencia de enriquecimiento — Advertencia con opciones lentas activadas

Enriquecimiento de código

Cuando está activo, mejora los bloques de código con:

Detección automática del lenguaje
Metadatos para resaltado de sintaxis
Mejor reconocimiento de la estructura

Enriquecimiento de fórmulas

Extrae fórmulas matemáticas y las convierte a LaTeX:

Ecuaciones en línea: $E = mc^2$
Ecuaciones en bloque con formato
Mejor representación en exportaciones HTML y Markdown

Clasificación de imágenes

Etiqueta imágenes por tipo:

Figura: esquemas, ilustraciones
Gráfico: barras, líneas, sectores
Foto: fotografías, capturas
Logo: logotipos, iconos
Tabla: imágenes de tabla (distinto de la extracción de tablas)

Descripción de imágenes

Usa modelos visión-lenguaje para generar leyendas:

Descripciones en lenguaje natural
Útil para accesibilidad (texto alternativo)
Mejora la búsqueda en el documento
Descarga del modelo en el primer uso

Requisitos de modelos

La descripción de imágenes requiere un modelo visión-lenguaje (~1–2 GB), descarga automática en el primer uso (puede tardar varios minutos).

Descarga previa de modelos

Para evitar esperas durante la conversión, puedes descargar modelos antes:

Abre Configuración
Ve a Enriquecimiento de documentos
Abajo, zona Descargar modelos por adelantado
Haz clic en Descargar junto al modelo deseado

Modelo	Tamaño	Función
Clasificador de imágenes	~350 MB	Tipo de imagen
Descriptor de imágenes	~2 GB	Leyendas con IA
Reconocedor de fórmulas	~500 MB	Extracción LaTeX
Detector de código	~200 MB	Lenguaje de programación

Progreso de descarga

Una barra muestra el estado. Los modelos se guardan en caché local; basta descargarlos una vez.

Fragmentación para RAG

Genera fragmentos de documento optimizados para generación aumentada por recuperación (RAG).

Funcionamiento

El documento se divide en fragmentos semánticos
Cada fragmento respeta la estructura
Los fragmentos incluyen metadatos (encabezados, números de página)
Los fragmentos demasiado pequeños pueden fusionarse

Configuración

Parámetro	Descripción	Predeterminado
Máx. tokens	Máximo de tokens por fragmento	512
Fusionar pares	Fusionar fragmentos pequeños	true

Formato de salida

{
  "chunks": [
    {
      "id": 1,
      "text": "Introduction to machine learning...",
      "meta": {
        "headings": ["Chapter 1", "Introduction"],
        "page": 1
      }
    }
  ]
}

Formatos de exportación

Formatos disponibles

Formato	Extensión	Descripción
Markdown	`.md`	Texto estructurado (encabezados, listas, enlaces)
HTML	`.html`	Listo para web con estilos
JSON	`.json`	Estructura completa del documento (sin pérdida)
Texto plano	`.txt`	Texto simple
DocTags	`.doctags`	Formato etiquetado
Tokens de documento	`.tokens.json`	Representación a nivel de tokens
Fragmentos RAG	`.chunks.json`	Fragmentos para aplicaciones RAG

Vista previa

El panel de exportación muestra una vista previa en vivo que se actualiza al cambiar de formato.

Vista previa por formato

Contenido dinámico: carga según el formato seleccionado
Insignia de formato: formato mostrado actualmente
Caché: cambio instantáneo entre formatos ya cargados

Modo renderizado o sin formato

En HTML y Markdown, alterna entre vista renderizada y código fuente:

Alternar vista previa — Alternar entre vista previa renderizada y sin formato

Modo renderizadoModo sin formato

HTML: formato, tablas, enlaces
Markdown: encabezados, negrita/cursiva, bloques de código, enlaces
Ideal para revisar el aspecto final

Markdown renderizado

Muestra el código fuente
HTML: etiquetas y atributos en bruto
Markdown: sintaxis (#, **negrita**, etc.)
Útil para copiar o depurar formato

Markdown sin formato

Otros formatos

JSON: formateado con sangría
Texto plano: tal cual
DocTags / tokens: vista en bruto

Vista previa JSON — Salida JSON formateada

Historial de conversiones

Accede a documentos convertidos anteriormente:

Estado de la conversión y metadatos
Volver a descargar archivos convertidos
Buscar por nombre de archivo
Estadísticas de conversión

Funciones del historial

Búsqueda: por nombre de archivo
Filtro: por estado (completado, fallido)
Exportar: historial en JSON
Recargar documento: clic en una entrada completada para abrir el resultado sin volver a convertir
Los documentos se guardan en disco tras la conversión
Se conserva la estructura completa; recarga instantánea
Deduplicación: mismo archivo y mismos ajustes reutilizan la salida almacenada
Generar fragmentos ahora: si no hay fragmentos RAG, generación bajo demanda con los ajustes de fragmentación actuales (sin reconversión)
Las conversiones con mismo contenido y ajustes que afectan al documento (OCR, tablas, imágenes) pueden servirse desde caché
Las salidas se almacenan una vez y se comparten (enlaces simbólicos)

Panel de estadísticas

Panel lateral para análisis de conversiones. Ábrelo con el botón Estadísticas en la cabecera o el enlace Ver estadísticas completas en el historial.

Resumen

Total de conversiones, aciertos/fallos, tasa de éxito
Tiempo medio de procesamiento y profundidad de cola

Almacenamiento

Subidas, salidas y almacenamiento total

Desgloses

Formatos de entrada, motores OCR, formatos de salida
Hardware (CPU/CUDA/MPS), tipos de origen
Categorías de error
Recuento con fragmentación RAG activa

Métricas ampliadas

Sistema: tipo de hardware (CPU/CUDA/MPS), núcleos CPU, uso actual de CPU (proceso backend de Duckling), información de GPU
Rendimiento: páginas/s medias y páginas/s por núcleo CPU
Distribución de tiempos: mediana, percentil 95 y 99
Páginas/s en el tiempo: gráfico en el historial
Rendimiento por configuración: páginas/s y tiempo por hardware, motor OCR y clasificador de imágenes