Fixturepack voor ETL-validatie

Pack met Parquet-, Avro-, CSV- en JSON-fixtures voor batch-ingestie, warehouse-loads en validatie van ETL-pijplijnen.

Download het pack

etl_validation_fixture_pack.zip · 4.6 KB

Beste voor

  • Validatie van staged loads en batchimport in ETL-pijplijnen.
  • Controles van schema-evolutie en formaatmixen in datawarehouses.
  • Herhaalbare setup voor ingestie, transformaties en regressies op laadjobs.

Inbegrepen fixtures

Filename Format Size Download
parquet_alltypes_plain_sample.parquet PARQUET 1.8 KB Download
parquet_list_columns_sample.parquet PARQUET 2.5 KB Download
avro_user_events_sample.avro AVRO 501 B Download
avro_schema_evolution_sample.avro AVRO 483 B Download
sqlite_batch_ingestion_sample.sqlite SQLITE 12.0 KB Download
ndjson_api_activity_stream_sample.ndjson NDJSON 313 B Download
csv_wide_table_sample.csv CSV 1.6 KB Download

Fixture Matrix

Gebruik de samengestelde PARQUET-matrix om vanuit dit pack naar de exacte onderliggende losse fixturevarianten te gaan.

Open primaire bibliotheek

Dit pack is gekoppeld aan de PARQUET-voorbeeldbibliotheek en werkt het best samen met downloads van individuele fixtures.

Open PARQUET-bibliotheek