Quels frameworks d'agents sont supportés ?
Framework-agnostique. N'importe quel agent qui produit (final_answer, tool_outputs) — ou par étape (step_output, step_context) — peut être wrappé. LangChain, LlamaIndex, CrewAI, AutoGen, boucles ReAct custom, Rust, Go, Python. L'API est HTTP, pas une intégration framework.
Faut-il changer mes prompts ?
Non. Wauldo est orthogonal au prompting. Il score ce qui sort. Changez les prompts pour réduire le taux de dérive ; gardez Wauldo pour mesurer si ça a marché.
Puis-je vérifier les étapes intermédiaires ?
Oui. Appelez fact_check par étape avec l'output de l'étape et son contexte local (le résultat du tool, le chunk récupéré, le raisonnement précédent). Voir le mode inline ci-dessus. Le trade-off est de la latence par étape contre un contrôle plus strict de la dérive.
Ça gère les traces d'agent en streaming ?
La vérification tourne sur le texte complet. Bufferisez la réponse finale (ou l'output de l'étape) avant de scorer. Pour l'UX token-by-token, streamez à l'utilisateur, puis vérifiez en tâche de fond et confirmez ou rétractez.
Et l'auto-réflexion d'agent ?
L'auto-réflexion suppose que l'agent sait quand il a tort. S'il le savait, il n'aurait pas halluciné en premier lieu. L'auto-critique est corrélée aux mêmes points aveugles que la génération initiale. Utilisez une mesure externe.