Google et Meta mettent à jour leurs modèles d'IA face à la montée en puissance de la "puce Alpha".

La semaine a été très chargée en actualités sur l’IA grâce à OpenAI, avec notamment un billet de blog controversé du PDG Sam Altman, le déploiement à grande échelle de l’Advanced Voice Mode, des rumeurs sur les centres de données 5GW, d’importants remaniements de personnel et des plans de restructuration spectaculaires.

Mais le reste du monde de l’IA ne marche pas au même rythme, faisant ses propres affaires et produisant de nouveaux modèles d’IA et de nouvelles recherches à la minute. Voici un récapitulatif des autres nouvelles notables de la semaine dernière en matière d’IA.

Mises à jour de Google Gemini

Crédit :

Google

Mardi, Google a annoncé des mises à jour de sa gamme de modèles Gemini, y compris la sortie de deux nouveaux modèles prêts à la production qui s’ajoutent aux versions précédentes : Gemini-1.5-Pro-002 et Gemini-1.5-Flash-002. L’entreprise a fait état d’améliorations de la qualité globale, avec des gains notables en mathématiques, dans la gestion des contextes longs et dans les tâches de vision. Google annonce une augmentation de 7 % des performances sur le benchmark MMLU-Pro et une amélioration de 20 % dans les tâches liées aux mathématiques. Mais comme vous le savez, si vous lisez Ars Technica depuis un certain temps, les tests d’IA ne sont pas aussi utiles que nous le souhaiterions.

Parallèlement aux mises à jour des modèles, Google a introduit des réductions de prix substantielles pour Gemini 1.5 Pro, réduisant les coûts des jetons d’entrée de 64 % et les coûts des jetons de sortie de 52 % pour les invites inférieures à 128 000 jetons. Comme l’a noté le chercheur en IA Simon Willison sur son blog, « à titre de comparaison, GPT-4o est actuellement à 5 dollars/un dollar.[million tokens] en entrée et 15 $/m en sortie et Claude 3.5 Sonnet est à 3 $/m en entrée et 15 $/m en sortie. Gemini 1.5 Pro était déjà le moins cher des modèles pionniers et il est maintenant encore moins cher ».

Google a également augmenté les limites de débit, Gemini 1.5 Flash prenant désormais en charge 2 000 requêtes par minute et Gemini 1.5 Pro 1 000 requêtes par minute. Google indique que les derniers modèles offrent une vitesse de sortie deux fois plus élevée et une latence trois fois plus faible que les versions précédentes. Ces changements pourraient permettre aux développeurs de créer des Applications avec Gemini plus facilement et à moindre coût qu’auparavant.

Meta lance Llama 3.2

Graphique promotionnel du Llama 3.2 — Crédit :

Meta

Mercredi, Meta a annoncé la sortie de Llama 3.2, une Mise à jour importante de sa gamme de modèles d’IA à poids ouvert que nous avons largement couverte par le passé. La nouvelle version comprend des modèles de langage de grande taille (LLM) compatibles avec la vision, avec 11 milliards et 90 milliards de paramètres, ainsi que des modèles légers de texte uniquement, avec 1 milliard et 3 milliards de paramètres, conçus pour les périphériques et les appareils mobiles. Meta affirme que les modèles de vision sont compétitifs par rapport aux principaux modèles fermés pour les tâches de reconnaissance d’images et de compréhension visuelle, tandis que les modèles plus petits sont plus performants que leurs concurrents de taille similaire pour diverses tâches textuelles.

Willison a réalisé des expériences avec certains des plus petits modèles 3.2 et a fait état de résultats impressionnants pour la taille des modèles. Ethan Mollick, chercheur en IA, a montré que Llama 3.2 fonctionnait sur son iPhone à l’aide d’une application appelée PocketPal.

Meta a également présenté les premières distributions officielles « Llama Stack », créées pour simplifier le développement et le déploiement dans différents environnements. Comme pour les versions précédentes, Meta met les modèles à disposition pour un téléchargement gratuit, avec des restrictions de licence. Les nouveaux modèles prennent en charge de longues fenêtres contextuelles allant jusqu’à 128 000 jetons.

L’IA AlphaChip de Google accélère la conception des puces

Photo promotionnelle de l'AlphaChip de Google. — Crédit :

Google DeepMind

Jeudi, Google DeepMind a annoncé ce qui semble être une avancée significative dans la conception de puces électroniques pilotée par l’IA, AlphaChip. Il s’agit d’un projet de recherche qui a débuté en 2020 et qui constitue désormais une méthode d’apprentissage par renforcement pour la conception de puces électroniques. Google aurait utilisé AlphaChip pour créer des « agencements de puces surhumains » dans les trois dernières générations de ses Tensor Processing Units (TPU), qui sont des puces similaires aux GPU conçues pour accélérer les opérations d’IA. Google affirme qu’AlphaChip peut générer des schémas de puces de haute qualité en quelques heures, contre des semaines ou des mois d’efforts humains. (Selon certaines informations, Nvidia utilise également l’IA pour concevoir ses puces).

Google a également publié sur GitHub un point de contrôle pré-entraîné d’AlphaChip, partageant ainsi les poids du Modèle avec le public. L’entreprise a indiqué que l’impact d’AlphaChip s’est déjà étendu au-delà de Google, avec des entreprises de conception de puces comme MediaTek qui ont adopté la Technologie et s’en sont inspirées pour leurs puces. Selon Google, AlphaChip a ouvert une nouvelle voie de recherche dans le domaine de l’IA pour la conception de puces, ce qui pourrait permettre d’optimiser chaque étape du cycle de conception des puces, de l’architecture informatique à la fabrication.

Ce n’est pas tout ce qui s’est passé, mais ce sont là les principaux faits marquants. L’industrie de l’IA ne montrant aucun signe de ralentissement à l’heure actuelle, nous verrons comment se déroulera la semaine prochaine.

Jad Marchy

+ posts

Jad MARCHI est un ardent défenseur de la technologie, passionné par son potentiel de transformation. Ayant accumulé une décennie d’expérience dans le secteur technologique, Jean a travaillé sur une variété de projets innovants qui l’ont amené à comprendre le paysage changeant de ce domaine. Il est fasciné par l’évolution rapide de la technologie et son impact sur notre société. Que ce soit l’intelligence artificielle, la robotique, la blockchain ou la cybersécurité, il est toujours à la recherche des dernières tendances. Ses articles cherchent à informer, à inspirer et à provoquer des réflexions sur la façon dont la technologie façonne notre avenir.

Mises à jour de Google Gemini

Meta lance Llama 3.2

L’IA AlphaChip de Google accélère la conception des puces

Jad Marchy

Log In

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections

Hey Friend!Before You Go…

Hey Friend!
Before You Go…