Tutoriels

Guides pratiques pour mettre l'IA en production.

Affichage 1-12 sur 155

TutorielsRoyaume-Uni
Ouvrir
27 juin 20267 min de lecturePlaybook AgentsIntermédiaire180 min build

Implémenter les skills de marketingskills/open-source-growth pour automatiser audits, README, démos et PR d'écosystème

Guide pour utiliser les « growth skills » du dépôt marketingskills/open-source-growth afin d'automatiser audits de repo, améliorations de README, construction de démos, packs de lancement et PR vers les registres. Inclut étapes rapides et conseils pratiques pour petites équipes et développeurs.

TutorielsFrance
Ouvrir
25 juin 20269 min de lectureDeep dive outillageIntermédiaire180 min build

Olmo Hybrid vs Olmo 3 — quels types de tokens chaque modèle prédit mieux

Tests reproductibles au niveau des tokens montrant que les modèles hybrides (Olmo Hybrid) sont meilleurs sur les tokens qui portent du sens (noms, verbes, adjectifs, coréférence) tandis que le transformer (Olmo 3) garde l'avantage sur la copie littérale.

TutorielsRoyaume-Uni
Ouvrir
24 juin 20267 min de lectureDeep dive outillageIntermédiaire240 min build

Manuel d'audit : utiliser euromesh pour estimer si les centres de données publics européens (y compris le Royaume‑Uni) peuvent entraîner un modèle d'IA de pointe

Un playbook de quatre heures (prototype) qui transforme le snapshot euromesh en un inventaire, un estimateur à 3 scénarios de GPU‑heures et une checklist décisionnelle d'une page pour juger si le calcul public européen suffit. Le repo de départ : https://github.com/sammysltd/euromesh

TutorielsFrance
Ouvrir
22 juin 20267 min de lectureDeep dive outillageIntermédiaire90 min build

Test paired-prompts (90 minutes) pour détecter les modèles qui changent de comportement pendant les benchmarks

Exécutez un test de 50–200 paires de prompts (style benchmark vs style déploiement) pour mesurer l'« awareness » d'évaluation — la fréquence à laquelle un modèle reconnaît qu'il est évalué (ex. Muse Spark 19,8 % vs 2,0 %) — et intégrez ce score dans les décisions d'achat.

TutorielsFrance
Ouvrir
21 juin 20269 min de lecturePlaybook AgentsIntermédiaire240 min build

Mesurer comment des modèles ouverts utilisent vos bibliothèques : benchmark reproductible pour agents

Construisez un harness répétable qui enregistre les étapes de planification des agents, les appels d'API, les retries, les tokens, le temps mur et le coût pour révéler les points de friction dans votre bibliothèque et guider les décisions de déploiement.

TutorielsFrance
Ouvrir
19 juin 20266 min de lecturePlaybook AgentsIntermédiaire90 min build

RootSign : journaux d'audit infalsifiables pour agents IA (open-source)

RootSign est une bibliothèque open-source pour la journalisation infalsifiable des décisions et actions d'agents IA (provenance). Hypothèses : le dépôt peut contenir des intégrations pour CrewAI/LangGraph, un enchaînement de hachage cryptographique (ex. SHA‑256), checkpoints d'approbation humaine, redaction PII et un stockage local Postgres — à vérifier dans le dépôt.

TutorielsFrance
Ouvrir
18 juin 20267 min de lecturePlaybook AgentsIntermédiaire240 min build

Déployer des jeux de données au format LeRobot du Hub Hugging Face vers des robots physiques avec Strands Agents

Guide traduit et localisé montrant comment Strands Robots compose des AgentTools LeRobot pour prendre des démonstrations au format LeRobot sur Hugging Face Hub, les évaluer en simulation, appliquer une porte de déploiement et exécuter un canari supervisé sur du matériel réel.

TutorielsRoyaume-Uni
Ouvrir
17 juin 20267 min de lecturePlaybook AgentsIntermédiaire90 min build

OrgForge : jeux de données d’entreprise synthétiques, amorcés et reproductibles pour tester des agents IA

Utilisez OrgForge pour générer localement des jeux de données d’entreprise synthétiques (JSON/CSV) avec seed reproductible. Utile pour valider des workflows d’agents IA, faire des tests rapides ou des tests de charge sans exposer de PII réelle.