Cas d'etude : echec du parseur CSV sur guillemets mal formes
Incident de fiabilite de parseur qui a expose des hypotheses fragiles dans l'ingestion CSV et la validation de schema.
Signal
Les workers d'ingestion plantaient par intermittence sur des lots CSV utilisateurs alors que les fixtures standards passaient.
Cause racine
La configuration du parseur supposait une conformite stricte des guillemets et ne prevoyait pas de voie de recuperation bornee pour les lignes mal formees.
Correctif
- Activer un mode de parsing tolerant avec gestion explicite des lignes mal formees.
- Capturer des diagnostics de parsing au niveau ligne pour revue operationnelle.
- Appliquer la validation de schema apres une tokenisation sure, pas avant.
Garde de regression
Creation de packs de fixtures CSV mal formes avec resultats attendus de parser et ajout d'assertions de resilience au crash dans les tests d'ingestion.
Outils recommandes
Generateur de matrice de tests d'upload
Generez des cas de test API reutilisables a partir d'un manifeste.
Ouvrir l'outilDiff de manifeste
Comparez deux manifestes pour detecter les fichiers ajoutes, retires ou modifies.
Ouvrir l'outilTesteur de politique de noms de fichiers
Verifiez des jeux de noms de fichiers selon des contraintes configurables.
Ouvrir l'outil