Sortie de Google Gemma 2 : donner du pouvoir aux chercheurs et aux développeurs du monde entier
Gemma 2 : Favoriser l'innovation mondiale en matière d'IA
Introduction à Gemma 2
L’IA a le potentiel de résoudre certains des défis les plus urgents de l’humanité, mais cela ne peut se produire que si chacun a accès aux outils nécessaires pour l’exploiter. C'est pourquoi, plus tôt cette année, nous avons présenté Gemma, une famille de modèles ouverts légers et de pointe, construits en utilisant les mêmes recherches et technologies que le Modèles Gémeaux. Depuis lors, la famille Gemma s'est élargie pour inclure CodeGemma, RecurrentGemma et PaliGemma, chacun offrant des capacités uniques pour diverses tâches d'IA. Ces modèles sont facilement accessibles grâce à des intégrations avec des partenaires comme Hugging Face, NVIDIA et Ollama.
Sortie mondiale de Gemma 2
Nous sommes ravis d'annoncer que Gemma 2 est désormais officiellement disponible pour les chercheurs et développeurs du monde entier. Proposé dans des tailles de paramètres de 9 milliards (9B) et 27 milliards (27B), Gemma 2 surpasse la première génération en termes de performances et d'efficacité. Grâce à des avancées significatives en matière de sécurité, le modèle 27B offre des alternatives compétitives aux modèles plus de deux fois plus grands. Cette performance remarquable est réalisable sur un seul GPU NVIDIA H100 Tensor Core ou hôte TPU, réduisant considérablement les coûts de déploiement.
Une nouvelle norme en matière d’efficacité et de performances des modèles d’IA
Architecture repensée pour des performances optimales
Gemma 2 repose sur une architecture repensée conçue pour offrir des performances et une efficacité d'inférence exceptionnelles. Voici quelques caractéristiques clés qui le distinguent :
Performances hors normes
Le modèle 27B Gemma 2 offre les meilleures performances de sa catégorie pour sa taille, offrant des alternatives compétitives aux modèles beaucoup plus grands. Le modèle 9B Gemma 2 excelle également, surpassant les autres modèles ouverts de sa catégorie, comme le Llama 3 8B. Pour une répartition détaillée de ses performances, reportez-vous au rapport technique.
Efficacité et économies inégalées
Conçu pour une inférence efficace, le modèle 27B Gemma 2 fonctionne avec une précision totale sur un seul hôte Google Cloud TPU, un GPU NVIDIA A100 Tensor Core de 80 Go ou un GPU NVIDIA H100 Tensor Core. Cette efficacité garantit non seulement des performances élevées, mais réduit également considérablement les coûts, rendant les déploiements d'IA plus accessibles et plus économiques.
Inférence ultra-rapide sur le matériel
Gemma 2 est optimisé pour une vitesse incroyable sur diverses configurations matérielles, des puissants ordinateurs portables de jeu et ordinateurs de bureau haut de gamme aux environnements basés sur le cloud. Vous pouvez découvrir Gemma 2 en toute précision dans Google AI Studio, débloquer les performances locales avec la version quantifiée en utilisant Gemma.cpp sur votre processeur, ou l'exécuter sur votre ordinateur personnel avec une NVIDIA RTX ou une GeForce RTX via Hugging Face Transformers.
Embrasser l’avenir de l’IA avec Gemma 2
Stimuler l’innovation en matière d’IA à l’échelle mondiale
La sortie de Gemma 2 représente une étape importante dans la rendre les technologies avancées d’IA plus accessibles aux chercheurs et développeurs du monde entier. En fournissant des modèles hautes performances, efficaces et rentables, Gemma 2 permet aux innovateurs de s'attaquer à des tâches d'IA complexes sans l'obstacle des systèmes propriétaires. Cette démocratisation des outils d’IA est cruciale pour favoriser la collaboration mondiale et accélérer les progrès technologiques.
Engagement envers la sécurité et l’IA éthique
Parallèlement à ses réalisations techniques, Gemma 2 intègre des améliorations substantielles en matière de sécurité pour garantir un déploiement éthique de l'IA. Ces avancées soulignent notre engagement à créer des technologies d’IA qui non seulement fonctionnent de manière exceptionnelle, mais qui respectent également des normes élevées de sécurité et de responsabilité.
Découvrez l'autre Actualités sur l'IA et événements technologiques ici dans AIfuturize!