闲社
标题:
【大模型】刚刚!OpenAI自研芯片Jalapeño发布:9个月流片,AI算力格局要变天?
[打印本页]
作者:
嗜血的兔子
时间:
昨天 05:54
标题:
【大模型】刚刚!OpenAI自研芯片Jalapeño发布:9个月流片,AI算力格局要变天?
就在昨天(6月24日),OpenAI联合Broadcom正式发布了首款自研AI推理芯片——Jalapeño。
这不是一颗普通的AI加速器,而是OpenAI从芯片架构到软件栈全栈自研的「 Intelligence Processor」。从设计到流片仅用了9个月,而且整个设计过程还由OpenAI自己的模型加速完成。
作为一个长期关注大模型基础设施的从业者,我觉得这件事的意义远比表面看起来要深远。
一、Jalapeño到底是什么?
根据官方技术披露,Jalapeño有几个关键特性:
专为LLM推理从零设计
:不是拿通用AI加速器改一改,而是完全围绕大模型推理的kernel、内存访问模式、网络通信模式优化
性能/功耗比显著优于现有方案
:早期测试显示能效比远超当前业界最优水平,工程样片已在实验室以目标频率和功耗运行GPT-5.3-Codex-Spark
全栈协同优化
:从芯片架构、kernel、内存系统、网络、调度到产品体验,每一层都围绕同一个目标——让模型更快、更可靠、更便宜
多代路线图的第一步
:计划2026年底开始部署,与Microsoft等合作伙伴建设GW级数据中心
Broadcom CEO Hock Tan的原话是:"这只是多代路线图的开始。"
二、为什么这件事很重要?
1. 算力自主可控的战略意义
过去OpenAI的算力完全依赖NVIDIA GPU。Jalapeño的发布意味着OpenAI开始掌握自己的算力命运。这不仅仅是成本问题,更是产品迭代速度的问题——当芯片、模型、产品三层都在自己手里时,优化空间是指数级的。Greg Brockman说得很直接:"设计更多栈 ourselves,我们能以更高效率服务更多智能。"
2. 9个月流片的「AI加速设计」范式
官方明确提到,Jalapeño是"我们认为高性能先进半导体领域有史以来最快的ASIC开发周期"。这个速度来自于OpenAI用自己的模型加速了部分设计和优化过程。
这是一个非常有趣的飞轮:更好的模型 → 帮助设计更好的芯片 → 提供更好的算力 → 训练出更好的模型。OpenAI正在把这个飞轮转起来。
3. 推理成本下降 = AI普及加速
Jalapeño的核心目标是降低推理成本。每一次推理成本的下降,都会直接转化为:ChatGPT响应更快、Codex能处理更长的任务、API更便宜、更多开发者能用得起。OpenAI说这是为了"让先进AI更广泛地可用"——翻译一下,就是降价抢市场。
4. 行业格局的变化
OpenAI不是第一个自研芯片的AI公司(Google有TPU、Amazon有Trainium/Inferentia),但它是第一个把自研芯片和顶级大模型能力深度绑定的。这意味着未来大模型的竞争不仅是模型质量的竞争,更是全栈基础设施的竞争。
三、对开发者和行业的影响
对于
开发者
:推理成本下降意味着更多AI应用变得经济可行,特别是需要大量token的长文本处理、代码生成等场景
对于
创业公司
:如果OpenAI通过自研芯片获得了显著的成本优势,第三方API厂商的压力会更大
对于
NVIDIA
:短期内影响有限(Jalapeño只用于推理,训练可能仍用GPU),但长期看,云厂商和AI公司自研芯片的趋势对NVIDIA的护城河是个挑战
对于
中国AI产业
:全栈自研的路径值得参考,但芯片制造的物理限制仍是关键瓶颈
四、一个值得思考的问题
OpenAI在博客中反复提到一个概念:"full-stack advantage"。当一家公司同时掌握模型、产品、芯片三层时,它能做到的事情是只掌握其中一层的公司无法想象的。
这让我想到一个更深层的问题:
未来的AI竞争,会不会从"谁有好模型"变成"谁有好基础设施"?
如果推理成本能下降10倍、100倍,那么模型本身的差距可能变得不那么重要——因为足够便宜的中等模型可以跑很多遍,通过ensemble达到顶级模型的效果。这在经济学上叫"good enough + cheap beats best"。
五、总结
Jalapeño的发布标志着OpenAI正式进军硬件领域,也标志着AI竞争进入了"全栈战争"时代。对普通用户来说,这意味着更快、更便宜的AI服务;对行业来说,这意味着算力格局正在发生结构性变化。
当然,Jalapeño的实际表现还有待验证。官方说详细技术报告会在未来几个月发布,到时候我们可以看看这颗芯片到底有多少真本事。
你怎么看OpenAI自研芯片这件事?
你觉得自研芯片能帮OpenAI建立真正的护城河吗?
NVIDIA的GPU霸主地位会受到多大冲击?
中国AI公司是否应该跟进全栈自研路线?
推理成本下降10倍后,AI应用会出现哪些现在想不到的新场景?
欢迎讨论!
作者:
Btw0
时间:
昨天 21:00
9个月流片确实猛,但最让我好奇的是它怎么绕过NVLink生态的?如果只靠定制网络协议堆叠,大规模集群的通信瓶颈能不能真的搞定?🤔
欢迎光临 闲社 (https://www.xianshe.com/)
Powered by Discuz! X5.0