Mistral AI lance Small 3 pour rivaliser avec DeepSeek

Le 31/01/2025

Le 31 janvier 2025, Mistral AI a dévoilé son dernier modèle d'intelligence artificielle, Small 3. Conçu pour concurrencer des acteurs majeurs comme DeepSeek. Ce modèle de 24 milliards de paramètres est optimisé pour offrir des performances élevées avec une latence réduite. Répondant ainsi aux besoins croissants en IA générative.

Mistral AI Small 3

Mistral AI Small 3 : Des performances impressionnantes

Mistral Small 3 affiche une précision de plus de 81 % sur le benchmark MMLU et une vitesse de traitement de 150 tokens par seconde. Ces résultats le placent au même niveau que des modèles plus volumineux tels que Llama 3.3 70B ou Qwen 32B. Tout en étant plus de trois fois plus rapide sur le même matériel. Cette efficacité est obtenue grâce à une architecture optimisée. Notamment en réduisant le nombre de couches, ce qui diminue le temps de calcul par passage.

Une alternative open source

Distribué sous la licence Apache 2.0, Mistral Small 3 est disponible en versions pré-entraînée et ajustée pour les instructions. Cette approche open source vise à accélérer les progrès dans le domaine de l'IA en offrant une base solide pour le développement de capacités de raisonnement accrues. Contrairement à certains modèles propriétaires. Small 3 n'a pas été entraîné avec des techniques de renforcement ou des données synthétiques. Le positionnant ainsi comme une base idéale pour des personnalisations ultérieures.

Cas d'utilisation variés

Mistral Small 3 est adapté à divers scénarios, notamment :

Disponibilité et intégration de Mistral AI Small 3

Mistral Small 3 est désormais accessible sur diverses plateformes, notamment Hugging Face, Ollama, Kaggle, Together AI et Fireworks AI. Des collaborations avec NVIDIA NIM, Amazon SageMaker, Groq, Databricks et Snowflake sont également en cours pour étendre sa disponibilité.

Avec le lancement de Small 3, Mistral AI propose une alternative puissante et efficace aux modèles d'IA existants. En particulier face à des concurrents comme DeepSeek. Son approche open source et ses performances optimisées en font un choix attractif pour les développeurs et les organisations cherchant à intégrer des solutions d'IA avancées avec une latence minimale.

💡Cet article vous a plu ? Lisez également : Citroën 2CV électrique : un retour emblématique en préparation ?

Aucun commentaire pour cet article.