Recherche

Affichage 109-120 sur 126

TutorielsÉtats-Unis
Ouvrir
06 févr. 20266 min de lecturePlaybook AgentsIntermédiaire240 min build

Déverrouiller le Codex Harness : comment nous avons construit l'App Server

Tutoriel technique pour développeurs et fondateurs : implémenter un App Server JSON‑RPC bidirectionnel qui expose des hypothèses internes, stream des frames incrémentales et persiste des diffs pour approbation humaine. Combine des patterns pratiques avec deux signaux de recherche (PCE, Empirical‑MCTS). Les artefacts concrets non documentés dans les extraits de recherche sont marqués HYPOTHESIS.

TutorielsRoyaume-Uni
Ouvrir
06 févr. 20267 min de lectureDeep dive outillageIntermédiaire120 min build

Waymo utilise le modèle monde Genie 3 de Google pour simuler des tornades et la faune dans les tests d’edge-cases

The Verge rapporte que Waymo utilise le modèle monde Genie 3 de Google/DeepMind pour générer des scènes de conduite photoréalistes et interactives afin de produire des edge-cases rares (tornades, grands animaux) et les injecter dans des bancs de test AV.

ActualitésRoyaume-Uni
Ouvrir
05 févr. 20266 min de lectureBrief sortie modèleIntermédiaire5 min build

Les labels de provenance et les métadonnées dépassés à mesure que les deepfakes se multiplient

Synthèse technique et produit — The Verge conclut que les manifests de provenance et les labels embarqués deviennent fragiles : la transcodification, le resharing et le réalisme des modèles sapent les garde‑fous fondés sur les métadonnées. Recommandations pratiques pour ingénieurs, fondateurs et équipes UK.

ActualitésÉtats-Unis
Ouvrir
05 févr. 20268 min de lectureBrief sortie modèleIntermédiaire5 min build

Super Bowl LX : publicités IA de plateforme, risques créatifs et priorités pour les builders

Super Bowl LX pourrait mettre en lumière des publicités marquées par les plateformes IA — de la pique d'Anthropic envers OpenAI au raté de Google Gemini. Ce brief résume les risques, les garde-fous pratiques et les priorités d'ingénierie pour les équipes qui produisent ou diffusent des créations assistées par IA.

ActualitésRoyaume-Uni
Ouvrir
04 févr. 20266 min de lectureBrief sortie modèleIntermédiaire5 min build

Bouygues & Perplexity Pro — plan d'action pour ingénieurs, développeurs et fondateurs (contexte UK inclus)

Bouygues Telecom interrompt l'accès gratuit à Perplexity Pro le 11 février 2026 : guide opérationnel et technique localisé pour équipes produit, ingénierie et fondateurs souhaitant répliquer ou gérer un pic d'activation.

Analyses de modèlesÉtats-Unis
Ouvrir
02 févr. 20268 min de lectureBrief sortie modèleIntermédiaire5 min build

Kaggle Game Arena : Poker et Werewolf ajoutés ; Gemini 3 Pro et Flash en tête des échecs

Le Game Arena de Kaggle ajoute Poker et Werewolf, élargissant les benchmarks vers la partial‑observabilité et la déduction sociale. Checklist rapide et cadre de décision pour équipes produit/IA (contexte États‑Unis).

ActualitésFrance
Ouvrir
30 janv. 20267 min de lectureDeep dive outillageIntermédiaire5 min build

LoRA et bounties sur les marketplaces : comment Civitai facilite des deepfakes ciblant des femmes réelles

Une analyse (Stanford + Indiana) relayée par MIT Technology Review montre que la marketplace Civitai vend des fichiers LoRA et héberge des bounties qui permettent de produire des deepfakes sur mesure — 86 % des demandes de deepfake utilisaient des LoRA et 90 % des requêtes ciblaient des femmes.

Analyses de modèlesRoyaume-Uni
Ouvrir
29 janv. 20267 min de lectureNotes fondateurIntermédiaire5 min build

Analyse d'Anthropic sur 1,5M de conversations identifie distorsions de réalité, de croyance et d'action dans Claude

Anthropic a analysé 1,5 million de conversations anonymisées et propose une taxonomie opérationnelle — distorsion de la réalité, de la croyance, et de l'action — pour mesurer quand un chatbot modifie les croyances, la perception ou les actions d'un utilisateur. Rare en pourcentage mais significatif à grande échelle ; recommandations de monitoring et d'audit pour les équipes produit et sécurité.

Analyses de modèlesÉtats-Unis
Ouvrir
27 janv. 20266 min de lectureBrief sortie modèleIntermédiaire5 min build

Prism : OpenAI intègre ChatGPT dans un éditeur d’articles scientifiques pour accélérer la rédaction et le tri de la littérature

OpenAI a publié Prism, un éditeur de texte gratuit intégrant ChatGPT pour assister la rédaction d’articles scientifiques et le tri de la littérature, ce qui soulève des arbitrages sur la provenance et la vérification des citations.

ActualitésFrance
Ouvrir
21 janv. 20266 min de lectureBrief sortie modèleIntermédiaire5 min build

ChatGPT 5.2 vs Gemini 3.2 Fast : confrontation Ars Technica et conséquences du choix d’Apple pour Siri

Ars Technica a comparé les modèles par défaut pour non‑abonnés — ChatGPT 5.2 vs Gemini 3.2 Fast — avec une suite de prompts complexes et une évaluation mixte (objectifs + subjectifs). Cet article traduit et localise les enseignements pour développeurs, fondateurs et passionnés d’IA en France, avec pistes d’implémentation et hypothèses à valider.