Normes de qualite
Derniere mise a jour : March 21, 2026
Integrite des donnees d'echantillon
- Chaque fichier liste est accessible via une URL directe stable.
- Les pages de fichiers exposent des empreintes SHA256 pour la verification d'integrite.
- Le type MIME declare et l'extension de fichier sont affiches pour les workflows de validation.
- Les conventions de nommage encodent le format et la taille ou duree cible.
Cas d'usage de test couverts
- Validation d'upload et parsing cote serveur.
- Verifications de compatibilite de lecture media et de transcodage.
- Pipelines d'extraction et de conversion de documents.
- Securite d'extraction d'archives et resilience des parseurs.
Rythme des revues
Les categories a fort trafic sont revues chaque mois pour les liens casses, la coherence des metadonnees et la derive du contenu. Les autres categories sont revues chaque trimestre.
Ce que nous evitons
- Le texte de remplissage auto-genere sans utilite technique.
- Les pages dupliquees avec peu de valeur differenciante.
- Les affirmations invérifiables sans metadonnees de support.