【重磅】Meta推出Llama 3.1 405B:世界最强的开源基础模型



刚刚Meta 发布了一系列新的 Llama 3.1 模型,其中包括我们期待已久的 405B。Llama 3.1 405B 独树一帜,具有无与伦比的灵活性、控制力和最先进的功能,可与最好的闭源模型相媲美‍
新模型将使开源社区能够解锁新的工作流程,例如合成数据生成和模型蒸馏。技术特点:
405B参数模型在超过15万亿个标记上训练,使用16000多个英伟达H100 GPU‍
上下文长度扩展到128K,支持8种语言‍
采用16位(BF16)到8位(FP8)的量化技术,降低计算需求‍
改进包括更严格的数据预处理、质量保证和过滤,采用仅解码器Transformer架构
具体来说Llama 3.1在 150 多个涵盖多种语言的基准数据集上评估了性能,此外还在现实场景中进行了大量人工评估。结果表明,405B 在一系列任务上可与 GPT-4o、Claude 3.5 和 Gemini Ultra 等领先的闭源模型相媲美


升级后的 Llama 3.1 8B 和 70B 模型也是同类产品中最好的,性能优于其他同尺寸模型,同时在实用性和安全性方面也比其前代产品更加平衡。这些较小的模型支持相同的改进版 128K 令牌上下文窗口、多语言性、改进的推理和最先进的工具使用,以实现更高级的用例

更良心的是Meta 还更新了许可证,首次允许开发人员使用 Llama 模型(包括 405B)的输出来改进其他模型
Llama系统与生态:
推出完整参考系统,包括Llama Guard 3和Prompt Guard等安全工具‍
提出"Llama Stack"标准接口,促进生态系统发展‍
与25多个合作伙伴(如AWS、NVIDIA、Google Cloud等)合作,提供广泛的部署选项‍
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~

👇‍
到顶部