Gemma 4 ajoute la Multi‑Token Prediction (MTP) — le décodage spéculatif peut accélérer la génération jusqu’à 3×
Google a publié des drafters expérimentaux Multi‑Token Prediction (MTP) pour Gemma 4 : un décodage spéculatif qui prédit plusieurs tokens à la fois et qui, d’après Google, peut accélérer la génération jusqu’à 3× sans perte de qualité signalée. Traduction et guide pratique pour petites équipes, fondateurs et développeurs (contexte US).