PDF use case

PDF Beispieldatei fuer OCR und Textextraktion

Validieren Sie OCR, Textextraktion und layoutbewusste Verarbeitung mit sauberen Text-PDFs, Scan-aehnlichen Seiten und verrauschten Bilddokumenten.

3.7 KB Manifest-JSON SHA256
Starter file

Download

pdf_scan_like_image_sample.pdf

3.7 KB application/pdf SHA256 22a2cb26d64c...
Checklist

Testing Steps

  1. Vergleichen Sie extrahierten Text zwischen Scan-aehnlichen, OCR-verrauschten und sauberen Text-PDF-Kontrollen.
  2. Pruefen Sie, wie Tabellen, Mehrspaltenlayout und mehrseitige Berichte die Textreihenfolge und Extraktion beeinflussen.
  3. Bestaetigen Sie Fallback-Meldungen, wenn die Extraktionsqualitaet bei bildlastigen PDF-Eingaengen sinkt.
Companion fixtures

Related Variants

pdf_ocr_noise_sample.pdf

7.9 KB · application/pdf

Herunterladen

pdf_single_page_text_sample.pdf

725 B · application/pdf

Herunterladen

pdf_multi_column_report_sample.pdf

3.3 KB · application/pdf

Herunterladen

pdf_table_report_sample.pdf

716 B · application/pdf

Herunterladen
Next steps

Related Pages