Parece que fue ayer cuando escribí sobre el impacto de Llama 3.1, y ahora nos enfrentamos a otro hito significativo en inteligencia artificial con el lanzamiento de Llama 3.2 el 25 de septiembre de 2024.
Introducción
Meta acaba de anunciar el llamas 3.2Una innovación que promete transformar el panorama de la IA de borde y visión. Esta nueva versión incluye modelos de lenguaje a gran escala (LLM) para visión de tamaño pequeño y mediano (11B y 90B) y modelos ligeros de solo texto (1B y 3B), diseñados para adaptarse a dispositivos móviles y de borde. Disponibles en versiones preentrenadas y optimizadas para instrucciones, estos modelos ofrecen una flexibilidad y un rendimiento excepcionales para una amplia gama de aplicaciones.
Novedades de Llama 3.2
Plantillas optimizadas para dispositivos móviles y Edge
Los modelos llamas 3.2 de 1B y 3B ahora admiten una longitud de contexto de hasta 128 mil fichas, estableciendo un nuevo estándar para aplicaciones de dispositivos como:
- Recuperación y resumen de conocimientos multilingües
- Seguimiento de instrucciones
- Reescribir tareas que se ejecutan localmente
Optimizados para el hardware de procesadores Qualcomm, MediaTek y ARM, estos modelos permiten un procesamiento eficiente sin la necesidad de una infraestructura pesada.
Avances en visión artificial
Los modelos de visión llamas 3.2 Los modelos 11B y 90B pueden reemplazar inmediatamente a sus contrapartes de texto, superando incluso a modelos de código cerrado como Claude 3 Haiku en tareas de comprensión de imágenes. A diferencia de otros modelos multimodales de código abierto, tanto los modelos preentrenados como los alineados están disponibles para su ajuste personalizado mediante melodía de antorcha, además de poder probarse con el asistente Meta AI.
Llama Stack: Simplificando el desarrollo
Meta está lanzando las primeras distribuciones oficiales de Pila de llamas, lo que simplifica significativamente la forma en que los desarrolladores trabajan con los modelos de Llama en diferentes entornos:
- Nodo único
- On-premises
- En las nubes
- En el dispositivo
Esto permite la implementación llave en mano de aplicaciones de generación aumentada de recuperación (RAG) y herramientas de seguridad integradas, acelerando el tiempo de desarrollo y reduciendo la complejidad.
Asociaciones estratégicas
En colaboración con socios como AWSDatabricks, Dell, Fireworks, Infosys e Juntos IAMeta está ampliando el alcance de Llama Stack a clientes empresariales. La distribución a dispositivos se realiza a través de PyTorch EjecutarTorch, mientras que la distribución de un solo nodo se ve facilitada por Ollama.
La apertura que impulsa la innovación
Meta continúa compartiendo su trabajo porque cree que La apertura impulsa la innovaciónLlama 3.2 lidera el camino en apertura, modificabilidad y rentabilidad, permitiendo que más personas logren avances creativos y transformadores utilizando IA generativa.
Disponibilidad
Los modelos llamas 3.2 Está disponible para descargarlos. llama.com e Abrazando la cara, además de ser accesible para el desarrollo inmediato en un amplio ecosistema de plataformas asociadas, que incluyen:
- AMD
- Google Cloud
- IBM
- microsoft Azure
- NVIDIA
- Oracle Cloud
- Y muchos otros
Pensamientos finales
Parece que fue ayer cuando hablé del impacto de Llama 3.1, y ahora Llama 3.2 llega para superarnos aún más. La velocidad a la que evoluciona la tecnología es realmente impresionante. Me entusiasma ver cómo se aplicarán estos avances en diferentes industrias y cómo pueden influir positivamente en nuestros proyectos y soluciones.









