// moteur de vérification pour agents IA

Des agents IA en qui avoir confiance.

La plupart des agents IA hallucinent. Wauldo le mesure, le prouve, et l'arrête. Collez n'importe quelle réponse, obtenez un support_score entre 0 et 1, et sachez quelles affirmations sont ancrées dans vos sources.

Gratuit · sans inscription · support score instantané. Version anglaise : wauldo.com ↗
// médiane adversaire · 4 runs
91%
Sur 70 cas adversaires. Intervalle 86–97. Taux d'hallucination 0,0 stable sur tous les runs.
// différenciateur
+48pt
Écart sur la résistance à l'injection de prompt face à LangChain, sur le même benchmark adversaire.
// pourquoi

La robustesse est une propriété système.

Pas une couche à boulonner. Un verifier post-hoc ne peut pas réparer ce que le pipeline de génération a déjà cassé. Si le LLM a cité un override admin injecté, le fact-check sur cette même réponse contre ces mêmes sources va souvent la valider.

01 · MESURABLE

Chaque réponse porte un verdict.

Sept verdicts — verified, partial, conflict, unverified, rejected, block, uncertain — plus un support score calibré dans [0,1]. Aucune réponse n'échappe au runtime sans une décision de vérification. Vous fixez le seuil.

02 · REPRODUCTIBLE

Les sources sont hostiles. Traitées comme telles.

Le contenu récupéré est classifié comme donnée ou instruction avant d'atteindre le prompt. Marqueurs d'injection strippés pre-LLM. Contradictions cross-source détectées et exposées — pas silencieusement mélangées.

03 · OBSERVABLE

Chaque transition d'état est un signal.

Durée par état, taux d'échec, taille fan-out, uptake parallel-group, temps total. Le ratio sum_state_time / execution_duration dit quand le workflow est réellement parallèle et quand il gaspille sa concurrence.

// sous le capot

Pourquoi l'écart tient.

Quatre points d'intégration. Enlevez-en un, les autres lignes du tableau vous montrent ce qui se passe.

01 · CLASSIFICATION

Sources traitées comme donnée.

Les marqueurs d'injection (fausses notes admin, overrides de rôle, impératifs cachés dans les documents) sont strippés avant d'atteindre le modèle. LangChain les laisse passer tels quels.

02 · STRUCTURE

JSON structuré avec citations obligatoires.

Le verifier opère sur des claims structurés avec IDs de sources. Les réponses free-form sont non-vérifiables post-hoc — c'est pour ça que boulonner un guard ne marche pas.

03 · BOUCLE

Retries pendant la génération.

Si la vérification rejette un claim, le prompt est corrigé et l'étape re-lancée. La correction après coup est impossible — le contenu injecté est déjà dans le contexte du modèle.

Arrêtez de shipper de l'IA non vérifiée.

Les hallucinations ne sont pas des cas limites. La vérification n'est pas optionnelle. La confiance se mesure. Offre gratuite, sans carte bancaire, 300 vérifications par mois.

$ curl api.wauldo.com/v1/fact-check