Кажется, только вчера я писал о влиянии Llama 3.1, а теперь мы стоим на пороге еще одной важной вехи в развитии искусственного интеллекта с выходом Llama 3.2 25 сентября 2024 года.
Введение
Meta только что объявила о Llama 3.2, инновация, которая обещает кардинально изменить ландшафт искусственного интеллекта для периферийных устройств и систем машинного зрения. Новая версия включает в себя крупномасштабные языковые модели (LLM) для систем машинного зрения малого и среднего размера (11B и 90B), а также облегченные текстовые модели (1B и 3B), разработанные для адаптации к мобильным и периферийным устройствам. Эти модели, доступные в предварительно обученных и настроенных версиях, обеспечивают исключительную гибкость и производительность для широкого спектра приложений.
Что нового в Llama 3.2
Шаблоны, оптимизированные для мобильных устройств и Edge
Ос модели Llama 3.2 1B и 3B теперь поддерживают длину контекста до 128 тысяч токенов, устанавливая новый стандарт для таких приложений устройств, как:
- Многоязычный поиск и обобщение знаний
- Выполнение инструкций
- Переписать задачи, выполняемые локально
Эти модели, оптимизированные для процессоров Qualcomm, MediaTek и ARM, обеспечивают эффективную обработку без необходимости использования сложной инфраструктуры.
Достижения в области компьютерного зрения
Модели видения Llama 3.2 Модели 11B и 90B могут мгновенно заменить свои текстовые аналоги, превосходя даже модели с закрытым исходным кодом, такие как Claude 3 Haiku, в задачах распознавания изображений. В отличие от других мультимодальных моделей с открытым исходным кодом, как предобученные, так и выровненные модели доступны для индивидуальной настройки с помощью torchtune, а также возможность тестирования с помощью помощника Meta AI.
Llama Stack: упрощение разработки
Meta выпускает первые официальные дистрибутивы Стек ламы, которые значительно упрощают работу разработчиков с моделями Llama в различных средах:
- Одноузловой
- On-помещения
- в облаке
- На устройстве
Это позволяет реализовать готовую реализацию приложений расширенной генерации восстановления (RAG) и интегрированных в систему безопасности инструментов, ускоряя время разработки и снижая сложность.
Стратегическое партнерство
В сотрудничестве с такими партнерами, как AWS, Databricks, Dell, Fireworks, Infosys e Вместе ИИMeta расширяет охват Llama Stack для корпоративных клиентов. Распространение на устройства осуществляется через PyTorch ExecuTorch, в то время как распределение по одному узлу облегчается Оллама.
Открытость, движущая инновациями
Мета продолжает делиться своей работой, потому что верит, что открытость стимулирует инновацииLlama 3.2 лидирует с точки зрения открытости, модифицируемости и экономической эффективности, позволяя большему количеству людей реализовывать творческие и преобразующие прорывы с помощью генеративного ИИ.
доступность
Ос модели Llama 3.2 доступны для скачивания по адресу llama.com e Обнимая лицо, а также доступен для немедленной разработки на широкой экосистеме партнерских платформ, включая:
- AMD
- Google Cloud
- IBM
- Microsoft Azure
- NVIDIA
- Oracle Cloud
- И многие другие
Последние мысли
Кажется, только вчера я рассказывал о влиянии Llama 3.1, а теперь Llama 3.2 готова поднять планку ещё выше. Скорость развития технологий поистине впечатляет. Мне не терпится увидеть, как эти достижения будут применяться в различных отраслях и как они смогут положительно повлиять на наши проекты и решения.







