Office Document Parsing Pack

Bundle of real DOCX and related document fixtures for office-document parsing, text extraction, and structured-content QA.

Baixar o pacote

office_document_parsing_pack.zip · 12.1 KB

Melhor para

  • DOCX parsing and text extraction across multi-section office documents.
  • Structured content QA with table-bearing documents and policy/manual layouts.
  • Repeatable setup for office-document ingestion and parsing workflows.

Fixtures incluidos

Nome do arquivo Formato Tamanho Baixar
docx_project_brief_sample.docx DOCX 2.6 KB Baixar
docx_meeting_notes_sample.docx DOCX 2.7 KB Baixar
docx_table_report_sample.docx DOCX 2.7 KB Baixar
docx_policy_manual_sample.docx DOCX 2.6 KB Baixar
pdf_multi_column_report_sample.pdf PDF 3.3 KB Baixar

Matriz de fixtures

Use a matriz curada de DOCX para sair deste pacote e chegar nas variantes unitarias exatas por tras dele.

Abrir biblioteca principal

Este pacote esta ancorado na biblioteca de amostras DOCX e funciona melhor junto com downloads individuais.

Abrir biblioteca DOCX