PDF use case
Fichier d'echantillon PDF pour OCR et extraction de texte
Validez l'OCR, l'extraction de texte et l'analyse sensible a la mise en page avec des PDF textes, scannes et bruites.
3.7 KB
JSON du manifeste
SHA256
Starter file
Download
pdf_scan_like_image_sample.pdf
Checklist
Testing Steps
- Comparez le texte extrait entre des PDF scannes, bruites par OCR et des temoins texte propres.
- Controlez l'effet des tableaux, colonnes multiples et rapports multi-pages sur l'ordre du texte et l'extraction.
- Verifiez les messages de repli quand la qualite d'extraction baisse sur des PDF riches en images.
Companion fixtures
Related Variants
pdf_ocr_noise_sample.pdf
Telechargerpdf_single_page_text_sample.pdf
Telechargerpdf_multi_column_report_sample.pdf
Telechargerpdf_table_report_sample.pdf
TelechargerNext steps