Engineering guide
Cas d'etude : echec du parseur CSV sur guillemets mal formes
Incident de fiabilite de parseur qui a expose des hypotheses fragiles dans l'ingestion CSV et la validation de schema.
Document
Code
Performance
Signal
Les workers d'ingestion plantaient par intermittence sur des lots CSV utilisateurs alors que les fixtures standards passaient.
Cause racine
La configuration du parseur supposait une conformite stricte des guillemets et ne prevoyait pas de voie de recuperation bornee pour les lignes mal formees.
Correctif
- Activer un mode de parsing tolerant avec gestion explicite des lignes mal formees.
- Capturer des diagnostics de parsing au niveau ligne pour revue operationnelle.
- Appliquer la validation de schema apres une tokenisation sure, pas avant.
Garde de regression
Creation de packs de fixtures CSV mal formes avec resultats attendus de parser et ajout d'assertions de resilience au crash dans les tests d'ingestion.
Outils recommandes