Confiance
Données et précision
Ce que TenderReader sait aujourd'hui, comment les extractions sont testées, et ce qui reste volontairement non publié.
Source
| Source | Total | Fraîcheur |
|---|---|---|
| Avis Find a Tender | 626 | 2026-06-12 |
| Avis BOAMP | 1195 | 2026-06-14 |
| Attributions Contracts Finder | 847 | 2026-06-12 |
Résultats d'évaluation datés
- Corpus
- v2
- Moteur
- deterministic-stub-v0
- Dossiers
- 15
- Champs
- 150/150
- Précision globale
- 100.0%
| Classe | Correct | Précision | Barre | Statut |
|---|---|---|---|---|
| Délais | 30/30 | 100.0% | 99% | Atteint sur corpus généré |
| Montants | 15/15 | 100.0% | 97% | Atteint sur corpus généré |
| Éligibilité | 26/26 | 100.0% | 97% | Atteint sur corpus généré |
| Critères | 26/26 | 100.0% | 97% | Atteint sur corpus généré |
| Périmètre | 15/15 | 100.0% | 97% | Atteint sur corpus généré |
| Livrables | 15/15 | 100.0% | 97% | Atteint sur corpus généré |
| Quantités | 15/15 | 100.0% | 97% | Atteint sur corpus généré |
| Lots | 8/8 | 100.0% | 97% | Atteint sur corpus généré |
Répartition langue: corpus v2 généré principalement en anglais; preuves françaises réelles existent pour un RC/DCE France Travail Services, mais sans corpus français automatisé ni score par langue.
Statut: la barre est atteinte sur le corpus généré, mais la barre publique 97% champs critiques / 99% délais n'est pas encore prouvée sur des dossiers réels avec un modèle de production.
Provenance
Les avis et attributions viennent de flux publics: Find a Tender, Contracts Finder et BOAMP. Les surfaces produit gardent le nom de la source et les mentions OGL/Etalab.
Méthode d'évaluation
La porte CI actuelle utilise le corpus v2: 15 dossiers générés, 150 champs étiquetés, plusieurs formats et secteurs, avec score par classe.
Ce corpus protège les régressions. Ce n'est pas encore une affirmation publique de précision sur des dossiers clients réels.
Chiffres de précision
Les chiffres ci-dessous viennent du corpus d'évaluation v2 et sont rendus depuis les données de l'évaluateur, pas réécrits à la main.
Ils protègent les régressions mais ne sont pas encore une affirmation de précision sur des dossiers clients réels ou un modèle LLM en production.