PDF use case
Archivo de muestra PDF para OCR y extraccion de texto
Valida OCR, extraccion de texto y parsing sensible al layout con PDF de texto, escaneados y documentos con ruido.
3.7 KB
Manifiesto JSON
SHA256
Starter file
Download
pdf_scan_like_image_sample.pdf
Checklist
Testing Steps
- Compara el texto extraido entre controles PDF escaneados, con ruido OCR y texto limpio.
- Revisa como tablas, columnas multiples y reportes de varias paginas afectan el orden del texto y la extraccion.
- Verifica mensajes de fallback cuando baja la calidad de extraccion en PDF con mucho contenido de imagen.
Companion fixtures
Related Variants
Next steps