PDF use case

Fichier d'echantillon PDF pour OCR et extraction de texte

Validez l'OCR, l'extraction de texte et l'analyse sensible a la mise en page avec des PDF textes, scannes et bruites.

3.7 KB JSON du manifeste SHA256
Starter file

Download

pdf_scan_like_image_sample.pdf

3.7 KB application/pdf SHA256 22a2cb26d64c...
Checklist

Testing Steps

  1. Comparez le texte extrait entre des PDF scannes, bruites par OCR et des temoins texte propres.
  2. Controlez l'effet des tableaux, colonnes multiples et rapports multi-pages sur l'ordre du texte et l'extraction.
  3. Verifiez les messages de repli quand la qualite d'extraction baisse sur des PDF riches en images.
Companion fixtures

Related Variants

pdf_ocr_noise_sample.pdf

7.9 KB · application/pdf

Telecharger

pdf_single_page_text_sample.pdf

725 B · application/pdf

Telecharger

pdf_multi_column_report_sample.pdf

3.3 KB · application/pdf

Telecharger

pdf_table_report_sample.pdf

716 B · application/pdf

Telecharger
Next steps

Related Pages