TutorielsFrance
OuvrirVAKRA : un benchmark exécutable pour diagnostiquer l'utilisation multi‑étapes d'outils par des agents
Guide localisé pour faire tourner VAKRA — un benchmark exécutable (8 000+ APIs locales, 62 domaines) — capturer des traces d'exécution complètes, reproduire des pannes multi‑étapes et améliorer des agents pas à pas.