Communiqués de presse
IBM enrichit sa famille de modèles Granite avec une nouvelle IA multimodale et de raisonnement conçue pour l'entreprise

ARMONK, N.Y., le 27 février 2025 - IBM (NYSE : IBM) a lancé aujourd'hui la nouvelle génération de sa famille de modèles de langage de grande taille (LLM) Granite - Granite 3.2 - dans le cadre d'un effort continu visant à fournir une IA d'entreprise petite, efficace et pratique pour un impact concret pour l’entreprise.
Tous les modèles Granite 3.2 sont disponibles sous la licence permissive Apache 2.0 sur Hugging Face. Certains modèles sont disponibles dès aujourd'hui sur IBM watsonx.ai, Ollama, Replicate et LM Studio, et devraient bientôt l'être sur RHEL AI 1.5 - apportant des fonctionnalités avancées aux entreprises et à la communauté open-source.
Les points forts sont les suivants :
- Un nouveau modèle de langage visuel (VLM) pour les tâches de compréhension de documents qui démontre des performances qui égalent ou dépassent celles de modèles beaucoup plus grands - Llama 3.2 11B et Pixtral 12B – dans les principaux benchmarks significatifs pour les entreprises DocVQA, ChartQA, AI2D et OCRBench[1]. En plus de données d'entraînement robustes, IBM a utilisé son propre kit d'outils Docling open-source pour traiter 85 millions de PDF et générer 26 millions de paires de questions-réponses synthétiques afin d'améliorer la capacité du VLM à gérer des flux de travail complexes contenant beaucoup de documents.
- Des fonctionnalités de chaîne de pensée pour un raisonnement amélioré dans les modèles 3.2 2B et 8B, avec la possibilité d'activer ou de désactiver le raisonnement pour optimiser l'efficacité. Grâce à cette capacité, le modèle 8B réalise des améliorations à deux chiffres par rapport à son prédécesseur dans les benchmarks de suivi d'instructions tels que ArenaHard et Alpaca Eval, sans compromettre la sécurité ou les performances[2]. En outre, grâce à l'utilisation de nouvelles méthodes de mise à l'échelle de l'inférence, le modèle Granite 3.2 8B peut être optimisé pour rivaliser avec les performances de modèles beaucoup plus grands tels que Claude3.5-Sonnet ou GPT-4o selon des benchmarks de raisonnement mathématique tels que AIME2024 et MATH500[3].
- Des options de taille réduite pour les modèles de sécurité Granite Guardian qui maintiennent les performances des modèles Granite 3.1 Guardian précédents avec une taille réduite de 30 %. Les modèles 3.2 introduisent également une nouvelle fonctionnalité appelée confiance verbalisée, qui offre une évaluation des risques plus nuancée qui reconnaît l'ambiguïté dans la surveillance de la sécurité.
La stratégie d'IBM visant à fournir des modèles d'IA plus petits et spécialisés pour les entreprises continue de démontrer son efficacité lors des tests, le modèle Granite 3.1 8B ayant récemment obtenu des notes élevées en termes de précision dans le cadre du benchmark Salesforce LLM for CRM.
La famille des modèles Granite est soutenue par un solide écosystème de partenaires, dont les principaux éditeurs de logiciels qui intègrent les modèles Granite dans leurs technologies.
« Chez CrushBank, nous avons pu constater que les modèles d'IA ouverts et efficaces d'IBM apportent une réelle valeur ajoutée à l'IA d'entreprise, en offrant un bon équilibre entre performance, rentabilité et évolutivité », a déclaré David Tan, CTO de CrushBank. « Granite 3.2 va encore plus loin avec de nouvelles fonctionnalités de raisonnement et nous sommes impatients de les explorer pour construire de nouvelles solutions agentiques ».
Granite 3.2 constitue une étape importante dans l'évolution du portefeuille et de la stratégie d'IBM visant à fournir une IA pratique et de petite taille aux entreprises. Bien que les approches de raisonnement par « chaîne de pensée » soient puissantes, elles nécessitent une puissance de calcul importante qui n'est pas nécessaire pour toutes les tâches. C'est pourquoi IBM a introduit la possibilité d'activer ou de désactiver la chaîne de pensée de manière programmatique. Pour les tâches plus simples, le modèle fonctionne sans raisonnement afin de réduire la charge de calcul inutile. En outre, d'autres techniques de raisonnement, telles que la mise à l'échelle de l'inférence, ont montré que le modèle Granite 8B peut égaler ou dépasser les performances de modèles beaucoup plus grands dans des benchmarks de raisonnement mathématique standards. L'évolution de méthodes telles que la mise à l’échelle de l'inférence reste un domaine d'intérêt majeur pour les équipes de recherche d'IBM[4].
Parallèlement aux modèles Granite 3.2 Instruct, Vision et Guardrail, IBM lance la nouvelle génération de ses modèles TinyTimeMixers (TTM) (moins de 10 millions de paramètres), avec des capacités de prévision à plus long terme, jusqu'à deux ans dans l'avenir. Ces modèles constituent des outils puissants pour l'analyse des tendances à long terme, notamment les tendances financières et économiques, la prévision de la demande de la chaîne d'approvisionnement et la planification saisonnière des stocks dans le commerce de détail.
« La prochaine ère de l'IA est celle de l'efficacité, de l'intégration et de l'impact sur le monde réel - où les entreprises peuvent obtenir des résultats puissants sans dépenses excessives en calcul », a déclaré Sriram Raghavan, VP, IBM AI Research. « Les derniers développements de Granite d'IBM, axés sur des solutions ouvertes, constituent une nouvelle avancée pour rendre l'IA plus accessible, plus rentable et plus porteuse de valeur pour les entreprises modernes. »
Pour en savoir plus sur Granite 3.2, vous pouvez lire cet article technique.
À propos d’IBM
IBM est un leader mondial du Cloud hybride et de l'IA, ainsi que des services aux entreprises, qui aide ses clients dans plus de 175 pays à capitaliser sur les connaissances issues de leurs données, à rationaliser leurs processus métier, à réduire leurs coûts et à acquérir un avantage concurrentiel dans leurs secteurs d'activité. Près de 4 000 entités gouvernementales et entreprises dans des domaines d'infrastructures critiques tels que les services financiers, les télécommunications et les soins de santé font confiance à la plateforme Cloud hybride d'IBM et à Red Hat OpenShift pour impacter leurs transformations numériques rapidement, efficacement et en toute sécurité. Les innovations révolutionnaires d'IBM en matière d'IA, d'informatique quantique, de solutions Cloud spécifiques à certains secteurs et de services aux entreprises offrent des options ouvertes et flexibles à nos clients. Tout cela est soutenu par l'engagement légendaire d'IBM en matière de confiance, de transparence, de responsabilité, d'inclusivité et de service.
Pour en savoir plus : www.ibm.com/fr-fr
Contacts Presse :
|
|
[1] Vision model benchmark results are available in IBM’s technical article, IBM Granite 3.2: Reasoning, Vision, Forecasting, and More, published February 26, 2025.
[2] Instruct model benchmark results are available in IBM’s technical article, IBM Granite 3.2: Reasoning, Vision, Forecasting, and More, published February 26, 2025.
[3] Inference scaling benchmark results are available in IBM’s technical research blog, Reasoning in Granite 3.2 Using Inference Scaling, published February 26, 2025.
[4] Reasoning in Granite 3.2 Using Inference Scaling, IBM, published February 26, 2025.
