Normes de qualite

Derniere mise a jour : March 21, 2026

Integrite des donnees d'echantillon

  • Chaque fichier liste est accessible via une URL directe stable.
  • Les pages de fichiers exposent des empreintes SHA256 pour la verification d'integrite.
  • Le type MIME declare et l'extension de fichier sont affiches pour les workflows de validation.
  • Les conventions de nommage encodent le format et la taille ou duree cible.

Cas d'usage de test couverts

  • Validation d'upload et parsing cote serveur.
  • Verifications de compatibilite de lecture media et de transcodage.
  • Pipelines d'extraction et de conversion de documents.
  • Securite d'extraction d'archives et resilience des parseurs.

Rythme des revues

Les categories a fort trafic sont revues chaque mois pour les liens casses, la coherence des metadonnees et la derive du contenu. Les autres categories sont revues chaque trimestre.

Ce que nous evitons

  • Le texte de remplissage auto-genere sans utilite technique.
  • Les pages dupliquees avec peu de valeur differenciante.
  • Les affirmations invérifiables sans metadonnees de support.