← 返回列表
Meta 发布 Llama 4,性能大幅超越 Llama 3
Meta发布Llama 4开源大模型
Meta正式发布Llama 4系列开源大语言模型,在多项基准测试中超越了前代Llama 3。这一发布进一步巩固了Meta在开源AI领域的领导地位。
模型版本
Llama 4提供多个版本,满足不同应用场景需求:Llama 4-8B轻量级版本,适合边缘设备和移动端部署;Llama 4-70B平衡性能和效率的主力版本;Llama 4-400B超大参数版本,性能接近GPT-4。
技术亮点
Llama 4采用了多项技术创新:改进的注意力机制,支持更长的上下文窗口(最高128K token);优化的训练数据混合策略,提升多语言能力;新的后训练对齐技术,提高安全性和有用性;支持工具调用和函数调用,便于构建AI Agent。
开源策略
Meta继续采用相对开放的开源策略,允许商业使用。但超大版本(400B)需要申请许可,Meta希望通过这种方式平衡开放创新和责任部署。Llama 4发布后,开发者社区反响热烈。Hugging Face上的下载量在发布首周就突破100万次,多个基于Llama 4的微调模型和衍生项目迅速涌现。