Llama 3.2 : La révolution de l'intelligence artificielle et de la vision Edge avec des modèles ouverts et personnalisables

Il semble que c'était hier que j'écrivais sur l'impact de Llama 3.1, et maintenant nous sommes confrontés à une autre étape importante dans l'intelligence artificielle avec la sortie de Llama 3.2 le 25 septembre 2024.

Introduction

Meta vient d'annoncer la Llama 3.2, une innovation qui promet de transformer le paysage de l'IA en périphérie et en vision. Cette nouvelle version propose des modèles de langage à grande échelle (LLM) pour la vision de petite et moyenne taille (11B et 90B) et des modèles légers en texte seul (1B et 3B), conçus pour s'adapter aux appareils mobiles et en périphérie. Disponibles en versions pré-entraînées et optimisées par les instructions, ces modèles offrent une flexibilité et des performances exceptionnelles pour un large éventail d'applications.

Quoi de neuf dans Llama 3.2

Modèles optimisés pour les appareils mobiles et Edge

Les modèles Llama 3.2 de 1B et 3B prennent désormais en charge une longueur de contexte allant jusqu'à 128 XNUMX jetons, établissant une nouvelle norme pour les applications d'appareils telles que :

Recherche et synthèse de connaissances multilingues
Suivi des instructions
Les tâches de réécriture s'exécutent localement

Optimisés pour le matériel des processeurs Qualcomm, MediaTek et ARM, ces modèles permettent un traitement efficace sans nécessiter d'infrastructure lourde.

Progrès en vision par ordinateur

Les modèles de vision Llama 3.2 Les modèles 11B et 90B peuvent remplacer immédiatement leurs homologues textuels, surpassant même les modèles propriétaires comme Claude 3 Haiku pour les tâches de compréhension d'images. Contrairement aux autres modèles multimodaux open source, les modèles pré-entraînés et alignés sont disponibles pour un réglage personnalisé grâce à mise au flambeau, en plus de pouvoir être testé avec l'assistant Meta AI.

Llama Stack : simplifier le développement

Meta publie les premières distributions officielles de Pile de flammes, qui simplifient considérablement la façon dont les développeurs travaillent avec les modèles Llama dans différents environnements :

Nœud unique
Sur place
Au nuage
Sur l'appareil

Cela permet la mise en œuvre clé en main d'applications de génération augmentée de récupération (RAG) et d'outils intégrés à la sécurité, accélérant ainsi le temps de développement et réduisant la complexité.

Partenariats stratégiques

En collaboration avec des partenaires tels que AWS, Databricks, Dell, Fireworks, Infosys e Ensemble IAMeta étend la portée de Llama Stack aux entreprises. La distribution sur les appareils s'effectue via PyTorch ExécuTorch, tandis que la distribution à nœud unique est facilitée par Ollama.

L'ouverture qui stimule l'innovation

Meta continue de partager son travail car il croit que l'ouverture stimule l'innovationLlama 3.2 ouvre la voie en matière d'ouverture, de modifiabilité et de rentabilité, permettant à davantage de personnes de réaliser des avancées créatives et transformatrices grâce à l'IA générative.

Disponibilité

Les modèles Llama 3.2 estão disponible pour les télécharger lama.com e Étreindre le visage, en plus d'être accessible pour un développement immédiat sur un large écosystème de plateformes partenaires, notamment :

AMD
Google Cloud
IBM
Microsoft Azure
NVIDIA
Oracle Cloud
Et plein d'autres

Dernières pensées

Il me semble qu'hier encore, je parlais de l'impact de Llama 3.1, et maintenant, Llama 3.2 place la barre encore plus haut. La vitesse à laquelle la technologie évolue est vraiment impressionnante. J'ai hâte de voir comment ces avancées seront appliquées à différents secteurs et comment elles influenceront positivement nos projets et nos solutions.

Retour

Nouvelles