Tag: LLM

Affichage 1-12 sur 53

23 juin 20266 min de lectureBrief sortie modèleIntermédiaire

Des annotateurs externalisés disent utiliser des chatbots publics pour fabriquer des dialogues d'entraînement « humains »

Des lanceurs d'alerte rapportent que des travailleurs sous-traités poussent des chatbots publics (ex. ChatGPT) pour générer des dialogues présentés comme produits par des humains, ce qui crée un risque de boucle de rétroaction dans les modèles. Checklist opérationnelle incluse, adaptée aux petites équipes au Royaume-Uni.

IA LLM qualité-des-données provenance UK

+2 de plus

sécurité conformité

TutorielsFrance

Ouvrir

22 juin 20267 min de lectureDeep dive outillageIntermédiaire90 min build

Test paired-prompts (90 minutes) pour détecter les modèles qui changent de comportement pendant les benchmarks

Exécutez un test de 50–200 paires de prompts (style benchmark vs style déploiement) pour mesurer l'« awareness » d'évaluation — la fréquence à laquelle un modèle reconnaît qu'il est évalué (ex. Muse Spark 19,8 % vs 2,0 %) — et intégrez ce score dans les décisions d'achat.

IA LLM sécurité benchmarks procurement

+2 de plus

evaluation-awareness observabilité

TutorielsFrance

Ouvrir

08 juin 20267 min de lecturePlaybook AgentsIntermédiaire180 min build

Comment Viktor utilise le prompt caching et des préfixes byte‑stables pour réduire le coût des threads d'agent

Viktor transforme l'historique répété d'un thread en lectures de cache peu coûteuses grâce à des préfixes byte‑stables, des outils exposés via SDK, des logs append‑only et une compaction en cache — un thread de 40 étapes est passé de $11.35 à $2.07 dans leur exemple.

prompt-caching cache viktor llm coût

+3 de plus

optimisation byte-stable threads

TutorielsFrance

Ouvrir

29 mai 20267 min de lecturePlaybook AgentsIntermédiaire240 min build

Reproduire les évaluations ITBench‑AA SRE et produire des rapports JSON prêts pour l'audit

Tutoriel reproductible pour exécuter les tâches SRE d'ITBench‑AA et produire des rapports JSON prêts pour l'audit (accuracy, avg_turns, false_positive_rate, task_count). Les modèles de pointe ont obtenu moins de 50 %.

ITBench‑AA SRE benchmark IA LLM

+3 de plus

reproductibilité HuggingFace IBM

ActualitésRoyaume-Uni

Ouvrir

22 mai 20266 min de lecturePlaybook AgentsIntermédiaire

Les « harnesses » d’agents (p. ex. OpenClaw) : comment ils transforment l’inférence des LLM, l’exploitation et l’usage CPU

Des couches d’orchestration légères — des « harnesses » d’agents comme OpenClaw — enveloppent les API des LLM pour activer des workflows à état, modifiant latence, coût, consommation CPU et compromis de sécurité.

IA LLM opérations sécurité CPU

+3 de plus

UK produit startups

Analyses de modèlesRoyaume-Uni

Ouvrir

16 mai 20266 min de lectureDeep dive outillageIntermédiaire

ai-ml-gpu-bench : un harness léger pour comparer CPU et GPU pour l'entraînement ML Python et l'inférence locale de LLMs (contexte UK)

Guide pour albedan/ai-ml-gpu-bench : clonez un petit harness pour mesurer l'entraînement ML Python et l'inférence locale de LLMs sur CPU vs GPU, et exportez des métriques pour comparer latence et coût.

benchmark GPU CPU ML LLM

+3 de plus

performance petites-équipes Royaume-Uni

ActualitésFrance

Ouvrir

11 mai 20267 min de lectureBrief sortie modèleIntermédiaire

Pourquoi les LLM « hallucinent » — fixes produit : triage, ancrage et monitoring

Synthèse en français d’une explainer vidéo sur les réponses confian tes mais fausses des LLM et checklist produit : vérifier, trier, ancrer et surveiller avant mise en production.

LLM hallucination produit monitoring triage

+3 de plus

localisation FR startup

TutorielsRoyaume-Uni

Ouvrir

08 mai 20269 min de lecturePlaybook AgentsIntermédiaire90 min build

Guide pilote pour raiyanyahya/kit : tester un contexte IA partagé entre éditeur, navigateur, mail, terminal et agents

Runbook pratique pour piloter raiyanyahya/kit — un bundle open-source (éditeur, navigateur, mail, terminal, agents). Guide pas à pas pour installation locale, métriques à mesurer et petit pilote pour réduire les changements de contexte.

IA pilotage open-source devtools LLM

+2 de plus

kit rai yanyahya

TutorielsFrance

Ouvrir

02 mai 20267 min de lecturePlaybook AgentsIntermédiaire480 min build

Exploration agentique d'espaces de PDE avec des modèles fondamentaux latents — guide pratique (d'après arXiv:2604.09584)

Traduction et adaptation en français du pattern présenté dans arXiv:2604.09584 : associer un modèle fondamental latent (LFM) — un surrogate génératif compact pour simulations paramétrées — à une orchestration multi‑agent pour explorer automatiquement des espaces de solutions de PDE à coût réduit.

LFMs PDE surrogate LLM multi-agent

+3 de plus

CFD exploration automatique arXiv:2604.09584

ActualitésRoyaume-Uni

Ouvrir

02 mai 20266 min de lecturePlaybook AgentsIntermédiaire

AWS Strands Agents : conception agent→outil qui a réduit l’utilisation de tokens LLM d’environ 96%

Résumé et guide pratique pour équipes et développeurs : l’approche « agent→outil » de Strands externalise l’extraction et la synthèse hors des prompts, réduisant fortement l’usage mesuré de tokens et améliorant coût, testabilité et protection des données. Source : thenewstack.io/strands-agents-tool-design

IA agents LLM optimisation coûts

+3 de plus

vie privée UK ingénierie

TutorielsRoyaume-Uni

Ouvrir

29 avr. 20268 min de lecturePlaybook AgentsIntermédiaire120 min build

Ragnerock (bêta publique) — créer des workflows LLM auditables pour convertir PDF, images et fichiers bruts en tables SQL et résultats prêts pour Jupyter (contexte UK)

Testez la bêta publique de Ragnerock pour transformer des PDF, images et HTML en enregistrements validés et auditables stockés dans votre base de données — interrogeables en SQL et accessibles depuis des notebooks Jupyter.

Ragnerock extraction LLM OCR PDF

+3 de plus

data-engineering auditable UK

TutorielsFrance

Ouvrir

22 avr. 20268 min de lectureBrief sortie modèleIntermédiaire45 min build

LibreThinker — copilote IA pour LibreOffice Writer avec modèle gratuit intégré et support Ollama/BYOK

Installez LibreThinker pour ajouter un copilote IA directement dans la barre latérale de LibreOffice Writer. Livré avec un modèle gratuit en ligne (sans inscription), prend en charge les clés API fournisseurs (BYOK) et les instances Ollama locales ; plus de 10 000 téléchargements déclarés.

LibreThinker LibreOffice IA LLM Ollama

+1 de plus

BYOK