Llama 3.2:开放且可定制的模型带来边缘人工智能和视觉革命

仿佛就在昨天,我写了关于 Llama 3.1 的影响,而现在,随着 2024 年 9 月 25 日发布的 Llama 3.2,我们又迎来了人工智能的另一个重要里程碑。

介绍

Meta 刚刚宣布 骆驼3.2这项创新有望彻底改变边缘和视觉 AI 格局。新版本包含适用于中小型视觉(11B 和 90B)的大规模语言模型 (LLM),以及专为移动和边缘设备设计的轻量级纯文本模型(1B 和 3B)。这些模型提供预训练版本和指令调优版本,可为各种应用提供卓越的灵活性和性能。

Llama 3.2 中的新功能

移动和 Edge 优化模板

模型 骆驼3.2 1B 和 3B 现在支持最长的上下文长度 128K 代币,为设备应用设立了新标准,例如:

  • 多语言知识检索与总结
  • 指导跟进
  • 重写本地运行的任务

这些模型针对高通、联发科和 ARM 处理器硬件进行了优化,无需繁重的基础设施即可实现高效处理。

计算机视觉的进步

视觉模型 骆驼3.2 11B 和 90B 模型可以立即取代文本模型,在图像理解任务上甚至超越 Claude 3 Haiku 等闭源模型。与其他开源多模态模型不同,预训练模型和对齐模型均可使用以下工具进行自定义调整: 火炬曲调,此外还可以通过 Meta AI 助手进行测试。

Llama Stack:简化开发

Meta 正在发布第一个官方发行版 火焰堆叠,这大大简化了开发人员在不同环境中使用 Llama 模型的方式:

  • 单节点
  • 本地
  • 努韦姆
  • 在设备上

这使得恢复增强生成 (RAG) 应用程序和安全集成工具的交钥匙实施成为可能,从而加快了开发时间并降低了复杂性。

战略合作伙伴关系

与以下合作伙伴合作 AWS、Databricks、戴尔、Fireworks、Infosys e 一起人工智能Meta 正在将 Llama Stack 的覆盖范围扩展到企业客户。设备分发通过 PyTorch 执行器,而单节点分布则通过 奥拉马.

开放推动创新

Meta 继续分享其工作成果,因为它相信 开放驱动创新Llama 3.2 在开放性、可修改性和成本效益方面处于领先地位,使更多人能够利用生成式人工智能实现创造性和变革性的突破。

可用性

模型 骆驼3.2 可从以下网址下载 llama.com e 拥抱脸,除了可以在广泛的合作伙伴平台生态系统上立即开发之外,还包括:

  • AMD
  • Google Cloud
  • IBM
  • Microsoft Azure
  • NVIDIA公司
  • Oracle云
  • 还有很多其他人

最后的想法

我昨天才刚刚讨论过 Llama 3.1 的影响,而现在 Llama 3.2 的到来又将标准提升到了一个新的高度。技术发展的速度确实令人印象深刻。我迫不及待地想看到这些进步将如何应用于不同的行业,以及如何对我们的项目和解决方案产生积极的影响。

Compartilhar