Nvidia a lancé Nemotron, une version avancée de Llama-3.1, conçue pour surpasser les modèles d’intelligence artificielle (IA) les plus avancés, y compris GPT-4.
Grâce à des données soignées et un matériel innovant, Nemotron promet des performances sans égal dans le paysage de l’intelligence artificielle. Voyons dans cet article tous les détails.
Summary
Nemotron de Nvidia dépasse GPT-4o et Claude-3 grâce à une puissance de calcul AI sans précédent
Comme anticipé, Nvidia a présenté son nouveau modèle d’intelligence artificielle, Llama-3.1-Nemotron-70B-Instruct, avec un impact disruptif.
Ce modèle, selon Nvidia, promet de surpasser les systèmes d’IA les plus avancés actuellement en circulation, comme GPT-4 d’OpenAI et Claude-3 d’Anthropic.
L’annonce, faite via un post sur X par le compte Nvidia AI Developer, a rapidement attiré l’attention des experts du secteur.
Le modèle Nemotron représente une version modifiée et améliorée du Llama-3.1-70B-Instruct de Meta, une plateforme AI open source.
La modification apportée par Nvidia, mise en évidence par la partie « Nemotron » du nom, reflète la contribution technologique significative de l’entreprise, qui a poussé le modèle à de nouveaux sommets de puissance et polyvalence.
L’idée de fond est que ce modèle puisse être plus « utile » et performant par rapport aux modèles plus populaires comme GPT-4 et Claude-3, grâce à un travail de tuning raffiné et à une infrastructure matérielle de pointe développée par Nvidia elle-même.
Nemotron naît dans le contexte de l’arène des chatbot, connue sous le nom de lmarena, un espace où différents modèles d’intelligence artificielle sont mis en confrontation.
Meta, avec sa série de modèles AI appelée « Llama », a fourni la base sur laquelle Nvidia a construit ce nouveau système.
L’intento principale era quello di creare un modèle AI open source che fosse accessibile aux développeurs pour ulteriori personalizzazioni.
Tuttavia, Nvidia ha voluto andare oltre, mettendo in gioco le sue risorse per creare un sistema d’intelligence artificielle capable de rivaliser et de surpasser les leaders du secteur.
Qu’est-ce qui distingue Nemotron?
Un des éléments clés qui a permis à Nemotron d’émerger est l’utilisation de set di dati soigneusement sélectionnés et des processus de mise au point hautement sophistiqués.
Nvidia a exploité ses énormes capacités de calcul, en utilisant du matériel de pointe, pour pousser le modèle Llama-3.1-70B au-delà de ses limites initiales.
Cela a permis de créer une version d’AI non seulement plus puissante, mais aussi plus « utile » du point de vue pratique.
Un terme qui, dans le domaine de l’intelligence artificielle, peut avoir de multiples interprétations, mais qui se réfère généralement à la capacité du modèle à fournir des réponses pertinentes, précises et opportunes.
Le benchmarking est l’une des méthodes utilisées pour évaluer l’efficacité d’un modèle d’intelligence artificielle. Cependant, il n’existe pas de méthodologie unique et définitive pour déterminer quel modèle est « le meilleur ».
Ceci est dû au fait que l’utilité et l’efficacité d’un modèle AI dépendent souvent d’évaluations subjectives et du contexte dans lequel il est utilisé.
Le benchmarking, en effet, consiste à soumettre divers modèles AI aux mêmes tests et à évaluer les résultats obtenus en termes d’utilité et de précision.
Dans le cas de Nemotron, Nvidia affirme que son nouveau modèle dépasse largement les principaux concurrents, y compris GPT-4o et Claude-3.
La compétition dans l’arène des chatbot est intense, et Nemotron semble prêt à gravir les classements.
Bien qu’il ne soit pas encore complètement répertorié dans les classements officiels de lmarena, Nvidia affirme que son modèle a obtenu un score de 85 au test « Difficile ». Une évaluation qui, si elle est confirmée, le placerait au sommet de cette catégorie particulière.
Ce résultat serait encore plus remarquable en considérant que Llama-3.1-70B, la base du Nemotron, est un modèle de niveau moyen par rapport à la version 405B de Llama-3.1, beaucoup plus complexe et avec un nombre de paramètres significativement plus élevé.
Base open source et autres paramètres
Pour donner une idée de la taille et de la complexité des modèles AI, GPT-4o, l’un des modèles les plus avancés d’OpenAI, a été développé avec plus de 1 trillion de paramètres.
Le nombre de paramètres est l’un des indicateurs clés de la puissance et de la capacité d’un modèle d’intelligence artificielle.
Tuttavia, Nvidia semble être parvenue à maximiser les performances de Nemotron malgré le nombre relativement inférieur de paramètres par rapport à GPT-4o.
Un autre aspect intéressant de Nemotron est sa base open source, qui le rend accessible à une vaste communauté de développeurs.
Cette approche open-source a le potentiel d’accélérer encore les progrès dans le domaine de l’intelligence artificielle, car elle permet à des experts du monde entier de contribuer à l’amélioration et à la personnalisation du modèle.
De plus, le fait que Nvidia ait décidé de baser son travail sur un projet open source comme Llama-3.1 démontre l’importance de la collaboration et de l’innovation partagée dans le progrès technologique.