Tag: traçage

Affichage 1-1 sur 1

TutorielsFrance
Ouvrir
18 avr. 20267 min de lecturePlaybook AgentsIntermédiaire180 min build

VAKRA : un benchmark exécutable pour diagnostiquer l'utilisation multi‑étapes d'outils par des agents

Guide localisé pour faire tourner VAKRA — un benchmark exécutable (8 000+ APIs locales, 62 domaines) — capturer des traces d'exécution complètes, reproduire des pannes multi‑étapes et améliorer des agents pas à pas.