JetBrains dévoile Mellum : un modèle IA open source dédié à la génération de code
JetBrains, bien connue pour ses outils de développement logiciels, franchit une étape majeure en rendant ouvert au public son premier modèle d’intelligence artificielle dédié à la génération de code : Mellum. Ce modèle, déjà intégré dans ses suites logicielles, est désormais disponible sur la plateforme Hugging Face, offrant aux développeurs un outil puissant pour compléter leur code.
Un modèle sophistiqué et spécialisé
Formé à partir de plus de 4 000 milliards de tokens, Mellum représente un investissement technique considérable. Avec 4 milliards de paramètres, c’est un modèle optimisé spécifiquement pour la complétion de code, c’est-à-dire la capacité à terminer des bouts de code en fonction du contexte environnant. Pour donner une idée, un million de tokens correspond environ à 30 000 lignes de code, plaçant Mellum parmi les solutions les plus avancées dans ce domaine.
Cette technologie est parfaite pour être intégrée aux environnements de développement professionnels, tels que les assistants de codage intelligents ou les outils éducatifs. JetBrains souligne également son utilisation pour la recherche ou encore pour des expérimentation de fine tuning afin d’adapter le modèle à des besoins précis.
Un apprentissage rigoureux et des fonctionnalités adaptées
Le modèle Mellum a été entraîné durant environ 20 jours sur un ensemble massif de serveurs équipés de GPU Nvidia H200, utilisant des données provenant notamment de codes disponibles sous licence permissive sur GitHub et d’articles anglophones de Wikipédia. La licence Apache 2.0 garantit la liberté d’utilisation et de modification par la communauté.
Pour être pleinement opérationnel, Mellum nécessite une phase de fine tuning : le modèle de base ne peut pas être utilisé tel quel pour vos projets. JetBrains a proposé des versions affûtées pour le langage Python, mais met en garde contre une utilisation directe en production, ces modèles restant principalement à des fins expérimentales.
Un outil prometteur, mais à utiliser avec prudence
Comme toute IA générative, Mellum présente des limites notamment en termes de sécurité. Selon un rapport récent, plus de 50 % des organisations rencontrent des problèmes de sécurité avec le code généré automatiquement. JetBrains souligne aussi que Mellum peut reproduire les biais présents dans les codes publics sur lesquels il a été entraîné, ce qui peut générer des suggestions de code parfois vulnérables ou non sécurisées.
Malgré ces défis, JetBrains voit en Mellum le début d’une nouvelle ère pour les outils de développement assistés par IA. Le but n’est pas d’avoir un modèle universel, mais plutôt un système ciblé capable de stimuler l’innovation, la collaboration et l’expérimentation dans l’écosystème des développeurs.
En résumé, Mellum, en devenant un projet open source, ouvre la porte aux développeurs et chercheurs pour contribuer à un modèle d’IA spécialisé dans la génération de code, tout en invitant à la vigilance pour éviter les risques liés à la sécurité et aux biais.
👉 Source ici