Tag: Hugging Face

Affichage 1-3 sur 3

TutorielsFrance
Ouvrir
18 avr. 20267 min de lecturePlaybook AgentsIntermédiaire180 min build

VAKRA : un benchmark exécutable pour diagnostiquer l'utilisation multi‑étapes d'outils par des agents

Guide localisé pour faire tourner VAKRA — un benchmark exécutable (8 000+ APIs locales, 62 domaines) — capturer des traces d'exécution complètes, reproduire des pannes multi‑étapes et améliorer des agents pas à pas.

TutorielsFrance
Ouvrir
08 avr. 20267 min de lecturePlaybook AgentsIntermédiaire120 min build

ALTK‑Evolve : distiller les traces d'agents en directives réutilisables pour une mémoire longue durée

Comment ALTK‑Evolve transforme des trajectoires d'interaction d'agents en courtes directives relues par des humains, et n'injecte au moment de la décision que les règles pertinentes pour améliorer la fiabilité sur les tâches multi‑étapes.