返回顶部
7*24新情报

【大模型】刚刚!OpenAI自研芯片Jalapeño发布:9个月流片,AI算力格局要变天?

[复制链接]
嗜血的兔子 显示全部楼层 发表于 昨天 05:54 |阅读模式 打印 上一主题 下一主题
就在昨天(6月24日),OpenAI联合Broadcom正式发布了首款自研AI推理芯片——Jalapeño。这不是一颗普通的AI加速器,而是OpenAI从芯片架构到软件栈全栈自研的「 Intelligence Processor」。从设计到流片仅用了9个月,而且整个设计过程还由OpenAI自己的模型加速完成。

作为一个长期关注大模型基础设施的从业者,我觉得这件事的意义远比表面看起来要深远。

一、Jalapeño到底是什么?

根据官方技术披露,Jalapeño有几个关键特性:


  • 专为LLM推理从零设计:不是拿通用AI加速器改一改,而是完全围绕大模型推理的kernel、内存访问模式、网络通信模式优化
  • 性能/功耗比显著优于现有方案:早期测试显示能效比远超当前业界最优水平,工程样片已在实验室以目标频率和功耗运行GPT-5.3-Codex-Spark
  • 全栈协同优化:从芯片架构、kernel、内存系统、网络、调度到产品体验,每一层都围绕同一个目标——让模型更快、更可靠、更便宜
  • 多代路线图的第一步:计划2026年底开始部署,与Microsoft等合作伙伴建设GW级数据中心


Broadcom CEO Hock Tan的原话是:"这只是多代路线图的开始。"

二、为什么这件事很重要?


  • 1. 算力自主可控的战略意义

    过去OpenAI的算力完全依赖NVIDIA GPU。Jalapeño的发布意味着OpenAI开始掌握自己的算力命运。这不仅仅是成本问题,更是产品迭代速度的问题——当芯片、模型、产品三层都在自己手里时,优化空间是指数级的。Greg Brockman说得很直接:"设计更多栈 ourselves,我们能以更高效率服务更多智能。"

  • 2. 9个月流片的「AI加速设计」范式

    官方明确提到,Jalapeño是"我们认为高性能先进半导体领域有史以来最快的ASIC开发周期"。这个速度来自于OpenAI用自己的模型加速了部分设计和优化过程。

    这是一个非常有趣的飞轮:更好的模型 → 帮助设计更好的芯片 → 提供更好的算力 → 训练出更好的模型。OpenAI正在把这个飞轮转起来。

  • 3. 推理成本下降 = AI普及加速

    Jalapeño的核心目标是降低推理成本。每一次推理成本的下降,都会直接转化为:ChatGPT响应更快、Codex能处理更长的任务、API更便宜、更多开发者能用得起。OpenAI说这是为了"让先进AI更广泛地可用"——翻译一下,就是降价抢市场。

  • 4. 行业格局的变化

    OpenAI不是第一个自研芯片的AI公司(Google有TPU、Amazon有Trainium/Inferentia),但它是第一个把自研芯片和顶级大模型能力深度绑定的。这意味着未来大模型的竞争不仅是模型质量的竞争,更是全栈基础设施的竞争。


三、对开发者和行业的影响


  • 对于开发者:推理成本下降意味着更多AI应用变得经济可行,特别是需要大量token的长文本处理、代码生成等场景
  • 对于创业公司:如果OpenAI通过自研芯片获得了显著的成本优势,第三方API厂商的压力会更大
  • 对于NVIDIA:短期内影响有限(Jalapeño只用于推理,训练可能仍用GPU),但长期看,云厂商和AI公司自研芯片的趋势对NVIDIA的护城河是个挑战
  • 对于中国AI产业:全栈自研的路径值得参考,但芯片制造的物理限制仍是关键瓶颈


四、一个值得思考的问题

OpenAI在博客中反复提到一个概念:"full-stack advantage"。当一家公司同时掌握模型、产品、芯片三层时,它能做到的事情是只掌握其中一层的公司无法想象的。

这让我想到一个更深层的问题:未来的AI竞争,会不会从"谁有好模型"变成"谁有好基础设施"?

如果推理成本能下降10倍、100倍,那么模型本身的差距可能变得不那么重要——因为足够便宜的中等模型可以跑很多遍,通过ensemble达到顶级模型的效果。这在经济学上叫"good enough + cheap beats best"。

五、总结

Jalapeño的发布标志着OpenAI正式进军硬件领域,也标志着AI竞争进入了"全栈战争"时代。对普通用户来说,这意味着更快、更便宜的AI服务;对行业来说,这意味着算力格局正在发生结构性变化。

当然,Jalapeño的实际表现还有待验证。官方说详细技术报告会在未来几个月发布,到时候我们可以看看这颗芯片到底有多少真本事。

你怎么看OpenAI自研芯片这件事?

  • 你觉得自研芯片能帮OpenAI建立真正的护城河吗?
  • NVIDIA的GPU霸主地位会受到多大冲击?
  • 中国AI公司是否应该跟进全栈自研路线?
  • 推理成本下降10倍后,AI应用会出现哪些现在想不到的新场景?


欢迎讨论!
回复

使用道具 举报

精彩评论1

noavatar
Btw0 显示全部楼层 发表于 昨天 21:00
9个月流片确实猛,但最让我好奇的是它怎么绕过NVLink生态的?如果只靠定制网络协议堆叠,大规模集群的通信瓶颈能不能真的搞定?🤔
回复

使用道具 举报

default_avator1
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
快速回复 返回顶部 返回列表