Llama 3.2: революция в области искусственного интеллекта и машинного зрения с открытыми и настраиваемыми моделями

Кажется, только вчера я писал о влиянии Llama 3.1, а теперь мы стоим на пороге еще одной важной вехи в развитии искусственного интеллекта с выходом Llama 3.2 25 сентября 2024 года.

Введение

Meta только что объявила о Llama 3.2, инновация, которая обещает кардинально изменить ландшафт искусственного интеллекта для периферийных устройств и систем машинного зрения. Новая версия включает в себя крупномасштабные языковые модели (LLM) для систем машинного зрения малого и среднего размера (11B и 90B), а также облегченные текстовые модели (1B и 3B), разработанные для адаптации к мобильным и периферийным устройствам. Эти модели, доступные в предварительно обученных и настроенных версиях, обеспечивают исключительную гибкость и производительность для широкого спектра приложений.

Что нового в Llama 3.2

Шаблоны, оптимизированные для мобильных устройств и Edge

Ос модели Llama 3.2 1B и 3B теперь поддерживают длину контекста до 128 тысяч токенов, устанавливая новый стандарт для таких приложений устройств, как:

Многоязычный поиск и обобщение знаний
Выполнение инструкций
Переписать задачи, выполняемые локально

Эти модели, оптимизированные для процессоров Qualcomm, MediaTek и ARM, обеспечивают эффективную обработку без необходимости использования сложной инфраструктуры.

Достижения в области компьютерного зрения

Модели видения Llama 3.2 Модели 11B и 90B могут мгновенно заменить свои текстовые аналоги, превосходя даже модели с закрытым исходным кодом, такие как Claude 3 Haiku, в задачах распознавания изображений. В отличие от других мультимодальных моделей с открытым исходным кодом, как предобученные, так и выровненные модели доступны для индивидуальной настройки с помощью torchtune, а также возможность тестирования с помощью помощника Meta AI.

Llama Stack: упрощение разработки

Meta выпускает первые официальные дистрибутивы Стек ламы, которые значительно упрощают работу разработчиков с моделями Llama в различных средах:

Одноузловой
On-помещения
в облаке
На устройстве

Это позволяет реализовать готовую реализацию приложений расширенной генерации восстановления (RAG) и интегрированных в систему безопасности инструментов, ускоряя время разработки и снижая сложность.

Стратегическое партнерство

В сотрудничестве с такими партнерами, как AWS, Databricks, Dell, Fireworks, Infosys e Вместе ИИMeta расширяет охват Llama Stack для корпоративных клиентов. Распространение на устройства осуществляется через PyTorch ExecuTorch, в то время как распределение по одному узлу облегчается Оллама.

Открытость, движущая инновациями

Мета продолжает делиться своей работой, потому что верит, что открытость стимулирует инновацииLlama 3.2 лидирует с точки зрения открытости, модифицируемости и экономической эффективности, позволяя большему количеству людей реализовывать творческие и преобразующие прорывы с помощью генеративного ИИ.

доступность

Ос модели Llama 3.2 доступны для скачивания по адресу llama.com e Обнимая лицо, а также доступен для немедленной разработки на широкой экосистеме партнерских платформ, включая:

AMD
Google Cloud
IBM
Microsoft Azure
NVIDIA
Oracle Cloud
И многие другие

Последние мысли

Кажется, только вчера я рассказывал о влиянии Llama 3.1, а теперь Llama 3.2 готова поднять планку ещё выше. Скорость развития технологий поистине впечатляет. Мне не терпится увидеть, как эти достижения будут применяться в различных отраслях и как они смогут положительно повлиять на наши проекты и решения.

Voltar

Новости