Google Gemini : Nouveaux modèles en production et améliorations
Le 24/09/2024
Google continue d'améliorer son écosystème IA avec de nouvelles avancées dans la série des modèles Gemini. Le 24 septembre 2024, la firme a annoncé la sortie de deux nouveaux modèles Gemini prêts pour la production : Gemini-1.5-Pro-002 et Gemini-1.5-Flash-002. Ces modèles offrent non seulement des performances accrues, mais aussi des tarifs plus avantageux pour les développeurs et utilisateurs d’IA. Voici un tour d'horizon des principales annonces et ce qu'elles signifient pour les utilisateurs.
Réduction de 50 % des prix pour Gemini 1.5 Pro
Les utilisateurs peuvent désormais profiter d'une baisse substantielle des coûts pour l’utilisation du modèle Gemini 1.5 Pro (jusqu'à 64 % de réduction sur les tokens d’entrée et 52 % sur les tokens de sortie pour des prompts de moins de 128K tokens). Cette réduction prendra effet le 1er octobre 2024. Les utilisateurs ayant des besoins de traitement complexes, tels que l'analyse de longs documents ou la génération de code, y verront une opportunité d'optimiser leurs coûts sans sacrifier la qualité.
Amélioration des limites de taux
Pour soutenir les développements à grande échelle, Google a doublé les limites de requêtes pour Gemini 1.5 Flash, passant de 1 000 RPM à 2 000 RPM. Le modèle Pro bénéficie également d’une hausse, atteignant 1 000 RPM contre 360 précédemment. Ces améliorations permettent aux développeurs de travailler avec plus d’agilité et de traiter des volumes plus importants de requêtes.
Performance accélérée et réduction de la latence
Google a égelement mis l'accent sur la rapidité des modèles. Avec une production 2x plus rapide et une latence réduite de 3x. Cela ouvre de nouvelles possibilités pour les applications nécessitant une grande réactivité, comme les systèmes de chat, les générateurs de contenu multimodal, ou encore les assistants intelligents.
Améliorations dans la qualité générale
Les nouveaux modèles de la série Gemini 1.5 sont optimisés pour une large gamme de tâches. Allant de la génération de texte à la résolution de problèmes mathématiques complexes. Les modèles bénéficient de :
- +7 % d’amélioration sur l’indice MMLU-Pro, un benchmark populaire d'évaluation des capacités d'IA,
- +20 % de gain sur les benchmarks de mathématiques (MATH et HiddenMath),
- Des performances accrues sur les tâches de compréhension visuelle et de génération de code Python, avec des améliorations de 2 à 7 %.
Ces progrès permettent aux modèles Gemini de mieux synthétiser des informations complexes. Comme des vidéos d'une heure ou des documents volumineux par exemple.
Réponses plus concises et amélioration de l'expérience utilisateur
Suite aux retours des développeurs, Google a affiné la concision des réponses générées par les modèles. Désormais, pour des tâches telles que le résumé de texte ou les réponses à des questions. Ainsi les réponses sont en moyenne 5 à 20 % plus courtes, ce qui réduit les coûts et améliore l'efficacité. Pour les utilisateurs préférant des réponses plus longues, il est toujours possible de personnaliser les prompts pour obtenir un dialogue plus détaillé.
Filtres de sécurité mis à jour
La sécurité reste au cœur des préoccupations de Google. Les derniers modèles sont dotés de paramètres de filtrage par défaut ajustés. Permettant aux développeurs de mieux contrôler les résultats en fonction de leurs besoins. Bien que les filtres ne soient pas appliqués par défaut, ils peuvent être activés selon les préférences des utilisateurs.
Lancement de Gemini 1.5 Flash-8B Experimental
Google introduit également une version améliorée du modèle Flash-8B, annoncé en août 2024. Cette nouvelle itération, appelée Gemini-1.5-Flash-8B-Exp-0924, affiche des performances significativement meilleures sur les tâches textuelles et multimodales. Elle est déjà disponible via Google AI Studio et l'API Gemini.
Qu'est-ce que cela signifie pour les développeurs et entreprises ?
Les mises à jour des modèles Gemini témoignent d'une volonté de rendre l'IA plus accessible, plus rapide et plus rentable. Ces avancées ne se limitent pas à des gains de performance, mais offrent également des outils concrets pour les développeurs cherchant à créer des solutions intelligentes à grande échelle. De la réduction des coûts à l'amélioration des performances. Ces modèles représentent une opportunité d’innover davantage dans des domaines tels que la génération de contenu, la résolution de problèmes complexes et la création de produits interactifs.
Pour ceux utilisant déjà les modèles Gemini, la migration vers les nouvelles versions peut se faire directement via l'API Gemini ou Vertex AI pour les entreprises de grande taille.
Les nouveaux modèles Gemini 1.5 Pro et Gemini 1.5 Flash apportent des améliorations significatives en termes de coût, de performance et de capacité. Tout en restant fidèles aux standards de sécurité de Google. Que vous soyez développeur, entreprise ou chercheur, ces outils permettent de construire des solutions innovantes et performantes à moindre coût. Profitez-en dès maintenant pour explorer ces nouveaux horizons !
💡Cet article vous a plu ? Lisez également : OpenAI dévoile O1 : L’IA qui raisonne comme un humain