仿佛就在昨天,我写了关于 Llama 3.1 的影响,而现在,随着 2024 年 9 月 25 日发布的 Llama 3.2,我们又迎来了人工智能的另一个重要里程碑。
介绍
Meta 刚刚宣布 骆驼3.2这项创新有望彻底改变边缘和视觉 AI 格局。新版本包含适用于中小型视觉(11B 和 90B)的大规模语言模型 (LLM),以及专为移动和边缘设备设计的轻量级纯文本模型(1B 和 3B)。这些模型提供预训练版本和指令调优版本,可为各种应用提供卓越的灵活性和性能。
Llama 3.2 中的新功能
移动和 Edge 优化模板
模型 骆驼3.2 1B 和 3B 现在支持最长的上下文长度 128K 代币,为设备应用设立了新标准,例如:
- 多语言知识检索与总结
- 指导跟进
- 重写本地运行的任务
这些模型针对高通、联发科和 ARM 处理器硬件进行了优化,无需繁重的基础设施即可实现高效处理。
计算机视觉的进步
视觉模型 骆驼3.2 11B 和 90B 模型可以立即取代文本模型,在图像理解任务上甚至超越 Claude 3 Haiku 等闭源模型。与其他开源多模态模型不同,预训练模型和对齐模型均可使用以下工具进行自定义调整: 火炬曲调,此外还可以通过 Meta AI 助手进行测试。
Llama Stack:简化开发
Meta 正在发布第一个官方发行版 火焰堆叠,这大大简化了开发人员在不同环境中使用 Llama 模型的方式:
- 单节点
- 本地
- 努韦姆
- 在设备上
这使得恢复增强生成 (RAG) 应用程序和安全集成工具的交钥匙实施成为可能,从而加快了开发时间并降低了复杂性。
战略合作伙伴关系
与以下合作伙伴合作 AWS、Databricks、戴尔、Fireworks、Infosys e 一起人工智能Meta 正在将 Llama Stack 的覆盖范围扩展到企业客户。设备分发通过 PyTorch 执行器,而单节点分布则通过 奥拉马.
开放推动创新
Meta 继续分享其工作成果,因为它相信 开放驱动创新Llama 3.2 在开放性、可修改性和成本效益方面处于领先地位,使更多人能够利用生成式人工智能实现创造性和变革性的突破。
可用性
模型 骆驼3.2 可从以下网址下载 llama.com e 拥抱脸,除了可以在广泛的合作伙伴平台生态系统上立即开发之外,还包括:
- AMD
- Google Cloud
- IBM
- Microsoft Azure
- NVIDIA公司
- Oracle云
- 还有很多其他人
最后的想法
我昨天才刚刚讨论过 Llama 3.1 的影响,而现在 Llama 3.2 的到来又将标准提升到了一个新的高度。技术发展的速度确实令人印象深刻。我迫不及待地想看到这些进步将如何应用于不同的行业,以及如何对我们的项目和解决方案产生积极的影响。







