PDF use case

Archivo de muestra PDF para OCR y extraccion de texto

Valida OCR, extraccion de texto y parsing sensible al layout con PDF de texto, escaneados y documentos con ruido.

3.7 KB Manifiesto JSON SHA256
Starter file

Download

pdf_scan_like_image_sample.pdf

3.7 KB application/pdf SHA256 22a2cb26d64c...
Checklist

Testing Steps

  1. Compara el texto extraido entre controles PDF escaneados, con ruido OCR y texto limpio.
  2. Revisa como tablas, columnas multiples y reportes de varias paginas afectan el orden del texto y la extraccion.
  3. Verifica mensajes de fallback cuando baja la calidad de extraccion en PDF con mucho contenido de imagen.
Companion fixtures

Related Variants

pdf_ocr_noise_sample.pdf

7.9 KB · application/pdf

Descargar

pdf_single_page_text_sample.pdf

725 B · application/pdf

Descargar

pdf_multi_column_report_sample.pdf

3.3 KB · application/pdf

Descargar

pdf_table_report_sample.pdf

716 B · application/pdf

Descargar
Next steps

Related Pages