Fixtures para validacao de codificacao

Fixtures de texto e dados estruturados para finais de linha, variantes UTF, comportamento de BOM e casos limite de codificacao.

Por que este fluxo importa

  • Valide diferencas entre UTF-8, UTF-16, BOM e manuseio de delimitadores.
  • Use TXT e CSV juntos para revelar inconsistencias em caminhos de importacao.
  • Util para indexacao, ingestao e importacao de suites de escritorio.

Pacotes recomendados

Pacote de teste de codificacao TXT

Pacote de fixtures de texto puro para deteccao de codificacao, finais de linha e testes de carga de parser.

txt_encoding_test_pack.zip · 1.9 KB

Pacote de teste de importacao CSV

Pacote de fixtures CSV realistas para importacao de planilhas, ingestao ETL e regressao de parser.

csv_import_test_pack.zip · 1.7 KB

Pacote de fixtures para extracao de documentos

Pacote de fixtures reais de PDF e TXT para extracao, analise de layout, validacao tipo OCR, tratamento de documentos protegidos e arquivos danificados.

document_extraction_fixture_pack.zip · 18.9 KB

Matrizes de fixtures

Matriz de fixtures TXT para codificacao

Escolha fixtures TXT para testes basicos, deteccao de codificacao, finais de linha, stress de linha longa e validacao de texto.

Matriz de fixtures para importacao CSV

Escolha o fixture CSV certo para importacao de planilhas, jobs ETL, delimitadores, codificacao e falhas de parser.

Fixtures sugeridos

Nome do arquivo Formato Tamanho Acoes
txt_utf8_multilingual_sample.txt TXT 94 B
txt_utf16le_sample.txt TXT 176 B
txt_crlf_log_sample.txt TXT 134 B
txt_minimal_readme_sample.txt TXT 100 B
csv_utf8_bom_sample.csv CSV 86 B
csv_semicolon_delimited_sample.csv CSV 121 B