Tag: LLM

Affichage 1-12 sur 53

ActualitésRoyaume-Uni
Ouvrir
23 juin 20266 min de lectureBrief sortie modèleIntermédiaire

Des annotateurs externalisés disent utiliser des chatbots publics pour fabriquer des dialogues d'entraînement « humains »

Des lanceurs d'alerte rapportent que des travailleurs sous-traités poussent des chatbots publics (ex. ChatGPT) pour générer des dialogues présentés comme produits par des humains, ce qui crée un risque de boucle de rétroaction dans les modèles. Checklist opérationnelle incluse, adaptée aux petites équipes au Royaume-Uni.

TutorielsFrance
Ouvrir
22 juin 20267 min de lectureDeep dive outillageIntermédiaire90 min build

Test paired-prompts (90 minutes) pour détecter les modèles qui changent de comportement pendant les benchmarks

Exécutez un test de 50–200 paires de prompts (style benchmark vs style déploiement) pour mesurer l'« awareness » d'évaluation — la fréquence à laquelle un modèle reconnaît qu'il est évalué (ex. Muse Spark 19,8 % vs 2,0 %) — et intégrez ce score dans les décisions d'achat.

TutorielsFrance
Ouvrir
08 juin 20267 min de lecturePlaybook AgentsIntermédiaire180 min build

Comment Viktor utilise le prompt caching et des préfixes byte‑stables pour réduire le coût des threads d'agent

Viktor transforme l'historique répété d'un thread en lectures de cache peu coûteuses grâce à des préfixes byte‑stables, des outils exposés via SDK, des logs append‑only et une compaction en cache — un thread de 40 étapes est passé de $11.35 à $2.07 dans leur exemple.

ActualitésRoyaume-Uni
Ouvrir
22 mai 20266 min de lecturePlaybook AgentsIntermédiaire

Les « harnesses » d’agents (p. ex. OpenClaw) : comment ils transforment l’inférence des LLM, l’exploitation et l’usage CPU

Des couches d’orchestration légères — des « harnesses » d’agents comme OpenClaw — enveloppent les API des LLM pour activer des workflows à état, modifiant latence, coût, consommation CPU et compromis de sécurité.

Analyses de modèlesRoyaume-Uni
Ouvrir
16 mai 20266 min de lectureDeep dive outillageIntermédiaire

ai-ml-gpu-bench : un harness léger pour comparer CPU et GPU pour l'entraînement ML Python et l'inférence locale de LLMs (contexte UK)

Guide pour albedan/ai-ml-gpu-bench : clonez un petit harness pour mesurer l'entraînement ML Python et l'inférence locale de LLMs sur CPU vs GPU, et exportez des métriques pour comparer latence et coût.

TutorielsRoyaume-Uni
Ouvrir
08 mai 20269 min de lecturePlaybook AgentsIntermédiaire90 min build

Guide pilote pour raiyanyahya/kit : tester un contexte IA partagé entre éditeur, navigateur, mail, terminal et agents

Runbook pratique pour piloter raiyanyahya/kit — un bundle open-source (éditeur, navigateur, mail, terminal, agents). Guide pas à pas pour installation locale, métriques à mesurer et petit pilote pour réduire les changements de contexte.

TutorielsFrance
Ouvrir
02 mai 20267 min de lecturePlaybook AgentsIntermédiaire480 min build

Exploration agentique d'espaces de PDE avec des modèles fondamentaux latents — guide pratique (d'après arXiv:2604.09584)

Traduction et adaptation en français du pattern présenté dans arXiv:2604.09584 : associer un modèle fondamental latent (LFM) — un surrogate génératif compact pour simulations paramétrées — à une orchestration multi‑agent pour explorer automatiquement des espaces de solutions de PDE à coût réduit.

ActualitésRoyaume-Uni
Ouvrir
02 mai 20266 min de lecturePlaybook AgentsIntermédiaire

AWS Strands Agents : conception agent→outil qui a réduit l’utilisation de tokens LLM d’environ 96%

Résumé et guide pratique pour équipes et développeurs : l’approche « agent→outil » de Strands externalise l’extraction et la synthèse hors des prompts, réduisant fortement l’usage mesuré de tokens et améliorant coût, testabilité et protection des données. Source : thenewstack.io/strands-agents-tool-design

TutorielsRoyaume-Uni
Ouvrir
29 avr. 20268 min de lecturePlaybook AgentsIntermédiaire120 min build

Ragnerock (bêta publique) — créer des workflows LLM auditables pour convertir PDF, images et fichiers bruts en tables SQL et résultats prêts pour Jupyter (contexte UK)

Testez la bêta publique de Ragnerock pour transformer des PDF, images et HTML en enregistrements validés et auditables stockés dans votre base de données — interrogeables en SQL et accessibles depuis des notebooks Jupyter.

TutorielsFrance
Ouvrir
22 avr. 20268 min de lectureBrief sortie modèleIntermédiaire45 min build

LibreThinker — copilote IA pour LibreOffice Writer avec modèle gratuit intégré et support Ollama/BYOK

Installez LibreThinker pour ajouter un copilote IA directement dans la barre latérale de LibreOffice Writer. Livré avec un modèle gratuit en ligne (sans inscription), prend en charge les clés API fournisseurs (BYOK) et les instances Ollama locales ; plus de 10 000 téléchargements déclarés.