Gemini 3 Pro est présenté comme le modèle le plus «raisonnable» de Google, et l'entreprise positionne ouvertement sa solution comme le leader du secteur à bien des égards. Des évaluations indépendantes le confirment.
Selon Artificial Analysis, le modèle est devenu le nouveau leader de leur indice intégral.
Indice d'IA d'Artificial Analysis. Données : Artificial Analysis.
Si l'on en croit les tests d'Artificial Analysis, Google a pris l'avantage sur ses concurrents dans les domaines des tâches intelligentes — raisonnement, compréhension des structures complexes, précision et multimodalité.
La performance en Analyse Profonde mérite une attention particulière. Lors de l'Examen Final de l'Humanité, qui évalue la capacité d'un modèle à résoudre des problèmes de niveau doctoral sans outils, Gemini 3 Pro a obtenu plus de 37%.
C'est plus de dix points de pourcentage au-dessus du précédent record. Sur ARC-AGI-2, l'un des benchmarks les plus difficiles qui évalue la capacité à dériver des règles et à les appliquer à de nouvelles situations, le modèle a également obtenu des scores supérieurs à la plupart des concurrents.
Résultats de dix tests spécialisés d'Artificial Analysis. Données : Artificial Analysis.
Les performances élevées sont également évidentes dans les tests mathématiques, a souligné Google. Dans le test MathArena Apex, où les questions d'une complexité extrême déséquilibrent traditionnellement les modèles, Gemini 3 Pro a obtenu 23,4%. Auparavant, ce chiffre était inatteignable pour d'autres systèmes, et les meilleurs résultats ne dépassaient pas 5,2%.
Résultats du test MathArena Apex. Données : MathArena.
Dans les tests multimodaux, le Gemini mis à jour occupe également les premières positions. Les experts attribuent directement cela à l'échelle potentiellement grande du modèle.
Cette hypothèse expliquerait la capacité de l'IA de Google à surpasser les produits d'autres entreprises dans des tâches impliquant l'analyse visuelle et la compréhension spatiale.
Séparément, une comparaison avec Claude et ChatGPT mérite d'être notée. Sur le benchmark SWE-Bench Verified, qui teste la capacité à gérer de manière autonome les tâches GitHub, le nouveau modèle est en retard sur Sonnet 4.5 d'un pour cent seulement. Dans d'autres métriques, le Gemini prend souvent l'avantage.
Résultats de tests comparatifs de différents modèles d'IA. Données : Google.
Un autre élément de preuve important est la vitesse du modèle. Artificial Analysis note que Gemini 3 Pro génère environ 128 tokens par seconde. C'est plus rapide que les performances de GPT-5.1, Kimi K2 Thinking et Grok 4.
Cela est très probablement dû à la propre plateforme matérielle de Google basée sur les processeurs Tensor Processing Unit (TPU).
Ainsi, pour un certain nombre de paramètres, le modèle rivalise avec confiance avec les flagships existants et dans de nombreux cas les surpasse. En même temps, le produit est en retard sur ses concurrents dans certains tests, mais généralement de peu.
Données techniques de Gemini 3 Pro. Données : Google.
Description des nouvelles fonctionnalités de Gemini 3 Pro. Données : Google.
Test Vending-Bench 2. Données : Google.








