Une croissance exponentielle génère 1 million de modèles d’IA sur Hugging Face

The Hugging Face logo in front of shipping containers.


Jeudi, la Plateforme d’Hébergement d’IA Hugging Face a dépassé pour la première fois le million de modèles d’IA, marquant ainsi une étape importante dans le domaine en pleine expansion de l’apprentissage automatique. Un Modèle d’IA est un programme informatique (utilisant souvent un Réseau neuronal) formé sur des données pour effectuer des tâches spécifiques ou faire des prédictions. La plateforme, qui a commencé comme une application de chatbot en 2016 avant de pivoter pour devenir un hub Open Source pour les modèles d’IA en 2020, héberge désormais un large éventail d’outils pour les développeurs et les chercheurs.

Le domaine de l’apprentissage automatique représente un monde bien plus vaste que les grands modèles de langage (LLM) comme ceux qui alimentent ChatGPT. Dans un billet publié sur X, Clément Delangue, PDG de Hugging Face, a expliqué que son entreprise hébergeait de nombreux modèles d’IA de premier plan, tels que « Llama, Gemma, Phi, Flux, Mistral, Starcoder, Qwen, Stable diffusion, Grok, Whisper, Olmo, Command, Zephyr, OpenELM, Jamba, Yi », mais aussi « 999 984 autres ».

Selon M. Delangue, la raison en est la personnalisation. Contrairement à l’erreur du « modèle unique », écrit-il, « les petits modèles spécialisés et optimisés pour votre cas d’utilisation, votre domaine, votre langue, votre matériel et, en général, vos contraintes sont meilleurs. En fait, peu de gens savent qu’il y a presque autant de modèles sur Hugging Face qui sont réservés à une seule organisation – pour que les entreprises construisent l’IA en privé, spécifiquement pour leurs cas d’utilisation ».

Graphique fourni par Hugging Face montrant le nombre de modèles d’IA ajoutés à Hugging Face au fil du temps, d’un mois à l’autre.

Graphique fourni par Hugging Face montrant le nombre de modèles d’IA ajoutés à Hugging Face au fil du temps, mois par mois.


Crédit :

Visage en étreinte

La transformation de Hugging Face en une importante plateforme d’IA suit le rythme accéléré de la recherche et du développement en matière d’IA dans l’industrie technologique. En quelques années, le nombre de modèles hébergés sur le site a augmenté de façon spectaculaire, tout comme l’intérêt pour ce domaine. Sur X, Caleb Fahlgren, ingénieur produit chez Hugging Face, a publié un tableau des modèles créés chaque mois sur la plateforme (ainsi qu’un lien vers d’autres tableaux).Les modèles augmentent de façon exponentielle de mois en mois et septembre n’est même pas encore terminé. »

Le pouvoir du réglage fin

Comme l’a indiqué Delangue ci-dessus, le grand nombre de modèles sur la plateforme découle de la nature collaborative de la plateforme et de la pratique consistant à affiner les modèles existants pour des tâches spécifiques. Le réglage fin consiste à prendre un modèle existant et à lui donner une formation supplémentaire pour ajouter de nouveaux concepts à son réseau neuronal et modifier la façon dont il produit des résultats. Les développeurs et les chercheurs du monde entier apportent leurs résultats, ce qui donne naissance à un vaste écosystème.

Par exemple, la plateforme héberge de nombreuses variantes des modèles Llama à pondération ouverte de Meta, qui représentent différentes versions affinées des modèles de base originaux, chacune étant optimisée pour des Applications spécifiques.

Le référentiel de Hugging Face comprend des modèles pour un large éventail de tâches. La navigation sur la page des modèles montre des catégories telles que la conversion d’images en texte, la réponse à des questions visuelles et la réponse à des questions sur des documents dans la section « Multimodal ». Dans la catégorie « Vision par ordinateur », il existe des sous-catégories pour l’estimation de la profondeur, la détection d’objets et la génération d’images, entre autres. Les tâches de traitement du langage naturel telles que la classification des textes et la réponse aux questions sont également représentées, de même que les modèles audio, tabulaires et d’apprentissage par renforcement (RL).

Capture d'écran de la page des modèles Hugging Face capturée le 26 septembre 2024.

Capture d’écran de la page Hugging Face models réalisée le 26 septembre 2024.

Capture d’écran de la page du modèle Hugging Face réalisée le 26 septembre 2024.


Crédit :

Visage en étreinte

Lorsqu’elle est classée en fonction du nombre de téléchargements, la liste des modèles Hugging Face révèle des tendances quant aux modèles d’IA que les utilisateurs trouvent les plus utiles. En tête, avec 163 millions de téléchargements, on trouve Audio Spectrogram Transformer du MIT, qui classe les contenus audio tels que la parole, la musique et les sons ambiants. Vient ensuite, avec 54,2 millions de téléchargements, BERT de Google, un modèle linguistique d’IA qui apprend à comprendre l’anglais en prédisant les mots masqués et les relations entre les phrases, ce qui lui permet de contribuer à diverses tâches linguistiques.

Les cinq modèles d’IA les plus performants sont all-MiniLM-L6-v2 (qui cartographie les phrases et les paragraphes en représentations vectorielles denses à 384 dimensions, utiles pour la recherche sémantique), Vision Transformer (qui traite les images comme des séquences de patchs pour effectuer la classification des images) et CLIP d’OpenAI (qui relie les images et le texte, ce qui lui permet de classer ou de décrire le contenu visuel à l’aide du langage naturel).

Quel que soit le modèle ou la tâche, la plateforme ne cesse de se développer. « Aujourd’hui, un nouveau référentiel (modèle, jeu de données ou espace) est créé toutes les 10 secondes sur HF », écrit M. Delangue. « À terme, il y aura autant de modèles que de référentiels de code et nous serons là pour ça ! »

Jad Marchy
+ posts

Jad MARCHI est un ardent défenseur de la technologie, passionné par son potentiel de transformation. Ayant accumulé une décennie d’expérience dans le secteur technologique, Jean a travaillé sur une variété de projets innovants qui l’ont amené à comprendre le paysage changeant de ce domaine. Il est fasciné par l’évolution rapide de la technologie et son impact sur notre société. Que ce soit l’intelligence artificielle, la robotique, la blockchain ou la cybersécurité, il est toujours à la recherche des dernières tendances. Ses articles cherchent à informer, à inspirer et à provoquer des réflexions sur la façon dont la technologie façonne notre avenir.

Back to Top
close

Log In

Forgot password?

Forgot password?

Enter your account data and we will send you a link to reset your password.

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections

Here you'll find all collections you've created before.

Hey Friend!
Before You Go…

Get the best viral stories straight into your inbox before everyone else!

Don't worry, we don't spam

Close
Close