Paquete de fixtures para extraccion de documentos

Paquete de fixtures PDF y TXT reales para extraccion, parseo de maquetacion, validacion tipo OCR, manejo de documentos protegidos y archivos danados.

10 Fixtures incluidos
3 Ideal para
document_extraction_fixture_pack.zip · 18.9 KB
Ideal para

Use Cases

  • Extraccion de campos y parseo de maquetacion fija en PDF limpios, escaneados y protegidos.
  • Extraccion de texto y validacion de codificacion con TXT en UTF-8, UTF-16 y archivos minimos.
  • Configuracion repetible para OCR, parsers y flujos de QA de extraccion documental.
Fixtures incluidos

Included Files

Nombre de archivo Formato Tamano Descargar
pdf_invoice_layout_sample.pdf
.pdf SHA256 45c10f35ba18...
PDF 774 B Descargar
pdf_form_like_sample.pdf
.pdf SHA256 6b5c49113a70...
PDF 773 B Descargar
pdf_scan_like_image_sample.pdf
.pdf SHA256 22a2cb26d64c...
PDF 3.7 KB Descargar
pdf_ocr_noise_sample.pdf
.pdf SHA256 19097c94fe1a...
PDF 7.9 KB Descargar
pdf_multi_column_report_sample.pdf
.pdf SHA256 6c5d36e07e3d...
PDF 3.3 KB Descargar
pdf_password_protected_sample.pdf
.pdf SHA256 37f22291ff8b...
PDF 3.2 KB Descargar
pdf_truncated_edge_case_sample.pdf
.pdf SHA256 537de4efe227...
PDF 701 B Descargar
txt_utf8_multilingual_sample.txt
.txt SHA256 1e219cd0bddf...
TXT 94 B Descargar
txt_utf16le_sample.txt
.txt SHA256 9033cba7c418...
TXT 176 B Descargar
txt_minimal_readme_sample.txt
.txt SHA256 1988d57016b2...
TXT 100 B Descargar
Paginas de estrategia relacionadas

Related Pages

Guias del mejor formato

Recomendaciones por caso de uso

Como convertir

Comparaciones

Matriz de fixtures

Related Matrices

Usa la matriz curada de PDF para pasar de este pack a las variantes exactas de fixtures individuales.

Abrir biblioteca principal

Browse Library

Este pack esta anclado a la biblioteca de muestras de PDF y funciona mejor junto a descargas individuales.

Abrir biblioteca de PDF