【重磅】Meta推出Llama 3.1 405B：世界最强的开源基础模型

2024-07-23 16:53#1 标记1

刚刚Meta 发布了一系列新的 Llama 3.1 模型，其中包括我们期待已久的 405B。Llama 3.1 405B 独树一帜，具有无与伦比的灵活性、控制力和最先进的功能，可与最好的闭源模型相媲美‍
新模型将使开源社区能够解锁新的工作流程，例如合成数据生成和模型蒸馏。技术特点：
405B参数模型在超过15万亿个标记上训练，使用16000多个英伟达H100 GPU‍
上下文长度扩展到128K，支持8种语言‍
采用16位(BF16)到8位(FP8)的量化技术，降低计算需求‍
改进包括更严格的数据预处理、质量保证和过滤，采用仅解码器Transformer架构
具体来说Llama 3.1在 150 多个涵盖多种语言的基准数据集上评估了性能，此外还在现实场景中进行了大量人工评估。结果表明，405B 在一系列任务上可与 GPT-4o、Claude 3.5 和 Gemini Ultra 等领先的闭源模型相媲美

升级后的 Llama 3.1 8B 和 70B 模型也是同类产品中最好的，性能优于其他同尺寸模型，同时在实用性和安全性方面也比其前代产品更加平衡。这些较小的模型支持相同的改进版 128K 令牌上下文窗口、多语言性、改进的推理和最先进的工具使用，以实现更高级的用例

更良心的是Meta 还更新了许可证，首次允许开发人员使用 Llama 模型（包括 405B）的输出来改进其他模型
Llama系统与生态：
推出完整参考系统，包括Llama Guard 3和Prompt Guard等安全工具‍
提出"Llama Stack"标准接口，促进生态系统发展‍
与25多个合作伙伴（如AWS、NVIDIA、Google Cloud等）合作，提供广泛的部署选项‍
⭐星标AI寒武纪，好内容不错过⭐
用你的赞和在看告诉我～

👇‍