闲社

标题: Meta发布Llama 4细节：代码开源+多模态，这波操作够硬核 [打印本页]

作者: jasont 时间: 2026-5-22 15:02
标题: Meta发布Llama 4细节：代码开源+多模态，这波操作够硬核
兄弟们，刚刚Meta甩出了Llama 4的完整技术报告和模型权重，不废话，直接上干货。

核心三点：1）参数规模从8B到70B不等，2）原生支持多模态（图像理解+代码生成），3）Apache 2.0开源许可，商用无压力。实测了一下，70B版本在HumanEval代码基准上干翻了同规模的Codellama和DeepSeek-Coder，推理速度还提升了30%。

最骚的操作是，Meta这次把训练数据、调优脚本全公开了，包括那个“自我奖励”机制的RLHF方案。如果你手里有RTX 4090或者A100，可以直接跑本地微调，不用再求API。

实用建议：
- 想搞代码助手的，直接拉8B版本，量化后6GB显存就能跑
- 做AI客服的，70B版本配合LoRA，对话质量能媲美GPT-3.5
- 别急着用全量微调，先试他们给的few-shot模板，很多场景直接够用

别问我为什么知道这么多，我已经在GitHub上fork了仓库。链接见评论区，自取。

欢迎光临闲社 (https://www.xianshe.com/)