Recherche

Affichage 277-288 sur 299

TutorielsRoyaume-Uni
Ouvrir
06 févr. 20267 min de lecture

Les règles échouent dans le prompt, réussissent à la frontière

Les workflows agentiques et la coercition par prompt sont la nouvelle surface d'attaque. Ce tutoriel décrit une stratégie de frontière concrète et déployable (moteur de politique + sandbox + canaux attestés) pour réduire le risque de compromission agentique — avec configurations, code, métriques et cadre coût/risque pour fondateurs (contexte Royaume‑Uni).

TutorielsÉtats-Unis
Ouvrir
06 févr. 20267 min de lectureDeep dive outillageIntermédiaire240 min build

Supervision interactive évolutive : prototype d'arbre décisionnel pour collecter des retours par nœud et orienter les LLM

Guide technique pour implémenter la « Scalable Interactive Oversight » (arXiv:2602.04210). Décomposez l'intention en arbre décisionnel récursif, collectez des signaux faibles par nœud, agrégerez-les en instructions globales et, en option, optimisez via des retours utilisateurs en ligne.

Analyses de modèlesFrance
Ouvrir
06 févr. 20266 min de lectureNotes fondateurIntermédiaire5 min build

Vérification sélective au niveau des états avec heuristiques apprises pour raisonnement LLM sous contrainte de coût de vérification

Résumé professionnel pour développeurs et fondateurs : pipeline de vérification sélective au niveau des états (filtrage de faisabilité, classement appris pré-vérification, allocation adaptative) — revendique + précision et −44% d'appels au vérificateur sur MATH (source : arXiv:2602.03975).

Analyses de modèlesRoyaume-Uni
Ouvrir
06 févr. 20266 min de lectureNotes fondateurIntermédiaire5 min build

Prompting Task‑Method‑Knowledge (TMK) — traduction et implications pour les développeurs et fondateurs (contexte UK)

Résumé professionnel en français (contexte UK) du papier arXiv « Knowledge Model Prompting Increases LLM Performance on Planning Tasks » (soumis 3 févr. 2026). Le document rapporte qu'un schéma de prompting TMK (Task / Method / Knowledge) améliore fortement les performances de planification des LLM sur PlanBench (Blocksworld) — passage rapporté de 31,5 % à 97,3 % sur instances symboliques opaques — et discute implications pratiques, risques et métriques à suivre.

TutorielsÉtats-Unis
Ouvrir
06 févr. 20266 min de lecturePlaybook AgentsIntermédiaire240 min build

Déverrouiller le Codex Harness : comment nous avons construit l'App Server

Tutoriel technique pour développeurs et fondateurs : implémenter un App Server JSON‑RPC bidirectionnel qui expose des hypothèses internes, stream des frames incrémentales et persiste des diffs pour approbation humaine. Combine des patterns pratiques avec deux signaux de recherche (PCE, Empirical‑MCTS). Les artefacts concrets non documentés dans les extraits de recherche sont marqués HYPOTHESIS.

TutorielsRoyaume-Uni
Ouvrir
06 févr. 20267 min de lectureDeep dive outillageIntermédiaire120 min build

Waymo utilise le modèle monde Genie 3 de Google pour simuler des tornades et la faune dans les tests d’edge-cases

The Verge rapporte que Waymo utilise le modèle monde Genie 3 de Google/DeepMind pour générer des scènes de conduite photoréalistes et interactives afin de produire des edge-cases rares (tornades, grands animaux) et les injecter dans des bancs de test AV.

ActualitésRoyaume-Uni
Ouvrir
05 févr. 20266 min de lectureBrief sortie modèleIntermédiaire5 min build

Les labels de provenance et les métadonnées dépassés à mesure que les deepfakes se multiplient

Synthèse technique et produit — The Verge conclut que les manifests de provenance et les labels embarqués deviennent fragiles : la transcodification, le resharing et le réalisme des modèles sapent les garde‑fous fondés sur les métadonnées. Recommandations pratiques pour ingénieurs, fondateurs et équipes UK.

ActualitésÉtats-Unis
Ouvrir
05 févr. 20268 min de lectureBrief sortie modèleIntermédiaire5 min build

Super Bowl LX : publicités IA de plateforme, risques créatifs et priorités pour les builders

Super Bowl LX pourrait mettre en lumière des publicités marquées par les plateformes IA — de la pique d'Anthropic envers OpenAI au raté de Google Gemini. Ce brief résume les risques, les garde-fous pratiques et les priorités d'ingénierie pour les équipes qui produisent ou diffusent des créations assistées par IA.

ActualitésRoyaume-Uni
Ouvrir
04 févr. 20266 min de lectureBrief sortie modèleIntermédiaire5 min build

Bouygues & Perplexity Pro — plan d'action pour ingénieurs, développeurs et fondateurs (contexte UK inclus)

Bouygues Telecom interrompt l'accès gratuit à Perplexity Pro le 11 février 2026 : guide opérationnel et technique localisé pour équipes produit, ingénierie et fondateurs souhaitant répliquer ou gérer un pic d'activation.