PDF use case
PDF Beispieldatei fuer OCR und Textextraktion
Validieren Sie OCR, Textextraktion und layoutbewusste Verarbeitung mit sauberen Text-PDFs, Scan-aehnlichen Seiten und verrauschten Bilddokumenten.
3.7 KB
Manifest-JSON
SHA256
Starter file
Download
pdf_scan_like_image_sample.pdf
Checklist
Testing Steps
- Vergleichen Sie extrahierten Text zwischen Scan-aehnlichen, OCR-verrauschten und sauberen Text-PDF-Kontrollen.
- Pruefen Sie, wie Tabellen, Mehrspaltenlayout und mehrseitige Berichte die Textreihenfolge und Extraktion beeinflussen.
- Bestaetigen Sie Fallback-Meldungen, wenn die Extraktionsqualitaet bei bildlastigen PDF-Eingaengen sinkt.
Companion fixtures
Related Variants
pdf_ocr_noise_sample.pdf
Herunterladenpdf_single_page_text_sample.pdf
Herunterladenpdf_multi_column_report_sample.pdf
Herunterladenpdf_table_report_sample.pdf
HerunterladenNext steps