Le bot annonce une fenêtre de remboursement de 30 jours. Votre politique est de 14 jours. Le client screenshote. Le service juridique ouvre un ticket.
Ton confiant. Conditions fabriquées. Un vrai client de l'autre côté qui le lit comme une politique. Une seule capture d'écran sur Twitter et le coût dépasse les économies — pendant des mois.
Le bot annonce une fenêtre de remboursement de 30 jours. Votre politique est de 14 jours. Le client screenshote. Le service juridique ouvre un ticket.
Le bot recommande le Produit A pour le use case B. Le Produit A ne supporte pas le use case B. Churn ou chargeback derrière.
Les LLM sont entraînés à paraître serviables. Serviable + faux est plus dangereux que non-serviable + correct.
La réponse passe par Wauldo avec les articles KB récupérés comme source_context. Chaque affirmation du brouillon est scorée contre ce que dit réellement la KB. Si le verdict revient en UNVERIFIED ou PARTIAL — ou si le support_score tombe sous votre seuil choisi — la réponse est flaggée, escaladée à un humain, ou réécrite avant d'atteindre le client.
Aucune réponse de bot ne sort du système si elle n'est pas groundée. Le LLM reste. Les fabrications confiantes, non.
from wauldo import Wauldo
w = Wauldo(api_key=os.environ["WAULDO_API_KEY"])
def send_reply(customer_msg: str, kb_chunks: list[str]) -> str:
draft = llm.generate(customer_msg, context=kb_chunks)
verified = w.fact_check(
text=draft,
source_context="\n\n".join(kb_chunks),
mode="lexical", # ~1s, assez rapide pour le chat
)
if verified.verdict != "SAFE":
escalate_to_human(customer_msg, draft, verified)
return FALLBACK_RESPONSE
return draft Client : « Quelle est votre politique de remboursement pour les téléchargements numériques ? »
Brouillon bot : « Vous avez 60 jours pour demander un remboursement complet sur tout achat numérique, sans condition. »
KB dit : « Les produits numériques ne sont pas remboursables. »
Wauldo : BLOCK, support_score 0.08. Le bot ne l'a jamais envoyé. Le responsable support a reçu un flag dashboard au lieu d'un litige chargeback.
Le retrieval est l'étape un. Grounder la réponse contre ce que vous avez récupéré est l'étape deux.
Les agents multi-étapes dérivent. Vérifiez chaque sortie de tool avant que le prochain appel parte.
Verdicts, support scores, preuves par affirmation. Une seule API. N'importe quelle stack.
Le mode lexical tourne en ~1 s sur une réponse typique de 300 mots. C'est dans la fenêtre d'attente humaine pour une réponse réfléchie. Pour les flows email / ticket asynchrones, le mode hybrid (3-5 s) vous donne un grounding cross-lingual sans bloquer l'agent.
Wauldo se place entre votre LLM et votre canal. N'importe quelle stack support qui vous offre un hook programmatique avant l'outbound — Intercom Fin, agents IA Zendesk, automations Front, ou un wrapper custom — peut s'intégrer en une après-midi. Vous gardez votre provider LLM, vous gardez votre KB, vous ajoutez un appel HTTP.
Oui. Récupérez le support_score et le verdict dans votre propre couche de policy. Bloquer, réécrire, avertir ou escalader — c'est votre décision. La plupart des équipes démarrent avec la gate verdict=SAFE et tunent un seuil numérique après une ou deux semaines de trafic réel.
Le mode hybrid utilise un embedding multilingue. Grounding cross-lingual FR / EN / ES testé. Autres langues supportées via fallback lexical — le recouvrement de tokens fonctionne entre scripts même quand le modèle sémantique ne couvre pas nativement la langue cible.
Les requêtes passent par votre clé API Wauldo, jamais poolées. Option self-host privée pour les flows SOC2 / HIPAA — contactez sales. Le backend utilise des SDKs sous licence MIT avec un chemin de requête testé ; vous pouvez auditer exactement ce qui quitte votre infrastructure.
Gratuit via RapidAPI. 500 vérifications/mois.