Il semble que c'était hier que j'écrivais sur l'impact de Llama 3.1, et maintenant nous sommes confrontés à une autre étape importante dans l'intelligence artificielle avec la sortie de Llama 3.2 le 25 septembre 2024.
Introduction
Meta vient d'annoncer la Llama 3.2, une innovation qui promet de transformer le paysage de l'IA en périphérie et en vision. Cette nouvelle version propose des modèles de langage à grande échelle (LLM) pour la vision de petite et moyenne taille (11B et 90B) et des modèles légers en texte seul (1B et 3B), conçus pour s'adapter aux appareils mobiles et en périphérie. Disponibles en versions pré-entraînées et optimisées par les instructions, ces modèles offrent une flexibilité et des performances exceptionnelles pour un large éventail d'applications.
Quoi de neuf dans Llama 3.2
Modèles optimisés pour les appareils mobiles et Edge
Les modèles Llama 3.2 de 1B et 3B prennent désormais en charge une longueur de contexte allant jusqu'à 128 XNUMX jetons, établissant une nouvelle norme pour les applications d'appareils telles que :
- Recherche et synthèse de connaissances multilingues
- Suivi des instructions
- Les tâches de réécriture s'exécutent localement
Optimisés pour le matériel des processeurs Qualcomm, MediaTek et ARM, ces modèles permettent un traitement efficace sans nécessiter d'infrastructure lourde.
Progrès en vision par ordinateur
Les modèles de vision Llama 3.2 Les modèles 11B et 90B peuvent remplacer immédiatement leurs homologues textuels, surpassant même les modèles propriétaires comme Claude 3 Haiku pour les tâches de compréhension d'images. Contrairement aux autres modèles multimodaux open source, les modèles pré-entraînés et alignés sont disponibles pour un réglage personnalisé grâce à mise au flambeau, en plus de pouvoir être testé avec l'assistant Meta AI.
Llama Stack : simplifier le développement
Meta publie les premières distributions officielles de Pile de flammes, qui simplifient considérablement la façon dont les développeurs travaillent avec les modèles Llama dans différents environnements :
- Nœud unique
- Sur place
- Au nuage
- Sur l'appareil
Cela permet la mise en œuvre clé en main d'applications de génération augmentée de récupération (RAG) et d'outils intégrés à la sécurité, accélérant ainsi le temps de développement et réduisant la complexité.
Partenariats stratégiques
En collaboration avec des partenaires tels que AWS, Databricks, Dell, Fireworks, Infosys e Ensemble IAMeta étend la portée de Llama Stack aux entreprises. La distribution sur les appareils s'effectue via PyTorch ExécuTorch, tandis que la distribution à nœud unique est facilitée par Ollama.
L'ouverture qui stimule l'innovation
Meta continue de partager son travail car il croit que l'ouverture stimule l'innovationLlama 3.2 ouvre la voie en matière d'ouverture, de modifiabilité et de rentabilité, permettant à davantage de personnes de réaliser des avancées créatives et transformatrices grâce à l'IA générative.
Disponibilité
Les modèles Llama 3.2 estão disponible pour les télécharger lama.com e Étreindre le visage, en plus d'être accessible pour un développement immédiat sur un large écosystème de plateformes partenaires, notamment :
- AMD
- Google Cloud
- IBM
- Microsoft Azure
- NVIDIA
- Oracle Cloud
- Et plein d'autres
Dernières pensées
Il me semble qu'hier encore, je parlais de l'impact de Llama 3.1, et maintenant, Llama 3.2 place la barre encore plus haut. La vitesse à laquelle la technologie évolue est vraiment impressionnante. J'ai hâte de voir comment ces avancées seront appliquées à différents secteurs et comment elles influenceront positivement nos projets et nos solutions.







