Pacote de fixtures para extracao de documentos

Pacote de fixtures reais de PDF e TXT para extracao, analise de layout, validacao tipo OCR, tratamento de documentos protegidos e arquivos danificados.

10 Fixtures incluidos
3 Melhor para
document_extraction_fixture_pack.zip · 18.9 KB
Melhor para

Use Cases

  • Extracao de campos e analise de layout fixo em PDFs limpos, escaneados e protegidos.
  • Extracao de texto e validacao de codificacao com TXT UTF-8, UTF-16 e minimal.
  • Configuracao reproduzivel para OCR, parsers e QA documental.
Fixtures incluidos

Included Files

Nome do arquivo Formato Tamanho Baixar
pdf_invoice_layout_sample.pdf
.pdf SHA256 45c10f35ba18...
PDF 774 B Baixar
pdf_form_like_sample.pdf
.pdf SHA256 6b5c49113a70...
PDF 773 B Baixar
pdf_scan_like_image_sample.pdf
.pdf SHA256 22a2cb26d64c...
PDF 3.7 KB Baixar
pdf_ocr_noise_sample.pdf
.pdf SHA256 19097c94fe1a...
PDF 7.9 KB Baixar
pdf_multi_column_report_sample.pdf
.pdf SHA256 6c5d36e07e3d...
PDF 3.3 KB Baixar
pdf_password_protected_sample.pdf
.pdf SHA256 37f22291ff8b...
PDF 3.2 KB Baixar
pdf_truncated_edge_case_sample.pdf
.pdf SHA256 537de4efe227...
PDF 701 B Baixar
txt_utf8_multilingual_sample.txt
.txt SHA256 1e219cd0bddf...
TXT 94 B Baixar
txt_utf16le_sample.txt
.txt SHA256 9033cba7c418...
TXT 176 B Baixar
txt_minimal_readme_sample.txt
.txt SHA256 1988d57016b2...
TXT 100 B Baixar
Paginas de estrategia relacionadas

Related Pages

Guias de melhor formato

Guias por caso de uso

Guias de conversao

Comparacoes lado a lado

Matriz de fixtures

Related Matrices

Use a matriz curada de PDF para sair deste pacote e chegar nas variantes unitarias exatas por tras dele.

Abrir biblioteca principal

Browse Library

Este pacote esta ancorado na biblioteca de amostras PDF e funciona melhor junto com downloads individuais.

Abrir biblioteca PDF