人工智能

OpenAI首颗自研芯片Jalapeño流片成功：9个月创纪录，推理成本砍半

作者：扣子AI助手日期：2026-07-03 09:03:07 阅读：330 次

OpenAI的第一颗自研芯片，终于从实验室走到了聚光灯下。6月底，Sam Altman从博通CEO陈福阳手中接过一片晶圆的照片刷屏科技圈——那不是PPT，而是一颗已经在实验室跑通真实模型的工程样片。它的代号叫Jalapeño（墨西哥辣椒），是OpenAI从头设计的第一颗AI推理芯片，专治推理太贵、太慢、太耗电的行业痛点。九个月从零到流片：行业纪录被碾碎在半导体行业，一颗高性能ASIC从架构设计到流

九个月从零到流片：行业纪录被碾碎

在半导体行业，一颗高性能ASIC从架构设计到流片，常规周期是两到三年。Google第一代TPU花了大约三年，传统芯片公司同等规模项目动辄五到七年。而OpenAI只用了九个月，这被称为高性能先进半导体领域有史以来最快的ASIC开发周期。

怎么做到的？核心是两条腿走路。第一，OpenAI用自家模型加速了芯片设计和优化流程。芯片设计最折磨人的环节不是架构，而是设计完成后成千上万次的验证、修改、再验证的死循环，这部分在项目周期里往往占掉大半时间。AI恰好擅长这种暴力枚举的脏活累活。OpenAI明确提到，他们用自家模型参与了芯片布局、功耗优化、信号完整性验证等环节——一个AI模型在设计下一代能让自己跑得更快的芯片，自我强化的飞轮已经开始转动。

第二，OpenAI拉来了真正的专业团队。硬件团队掌门人Richard Ho曾在Google做了九年TPU芯片工程，最高做到高级工程总监，参与发明的机器学习辅助芯片设计方法让多个TPU项目第一次流片就成功。2023年底加入OpenAI后，他迅速拉起一支约40人的精锐部队。芯片架构由OpenAI自己定义，工程实现和网络连接技术由博通负责，板卡机架和系统集成由Celestica完成，制造端则交给台积电。三家各司其职，OpenAI出脑子，博通出肌肉，Celestica出手脚。

只做推理不碰训练：精准切入成本死穴

Jalapeño有个非常明确的定位：只做推理，不搞训练。训练是教模型读书认字的阶段，需要极其恐怖的算力密度和海量高带宽内存，英伟达GPU凭借CUDA生态筑起了几乎无法逾越的护城河。推理则是模型答题的阶段，模型已经定型，只需在既定框架下快速、低成本地处理海量用户请求，最适合用专用芯片做精准优化。

Jalapeño正是冲着这个死穴来的。博通CEO陈福阳透露，跟市面上主流AI GPU相比，Jalapeño能把推理成本砍掉接近50%。早期测试显示，其每瓦性能大幅优于当前业界最先进水平，陈福阳甚至放话说这颗芯片的表现足以和英伟达Blackwell、Google TPU掰手腕。

更重要的是，Jalapeño不是通用芯片，而是围绕OpenAI实际运行的模型、核心算子、数据搬运、网络通信和调度需求做的软硬件协同优化。通过减少数据搬运，平衡计算、内存和网络资源，把芯片的实际利用率拉到最高。目前工程样品已在目标频率和功耗下成功运行GPT-5.3-Codex-Spark，不是PPT，是真跑起来了。

从买算力到设计算力的战略转身

OpenAI不是第一个自研芯片的AI公司。Google在2015年就部署了首代TPU，AWS先后搞了Inferentia和Trainium，Meta围绕推荐和广告开发MTIA。但注意一个关键区别：Google、AWS、Meta都是云计算或社交巨头，本身就有海量基础设施需求，每年在数据中心上的投入几百亿美金。OpenAI是第一个以纯模型厂商身份下场做芯片的。

这意味着一种趋势正在往下渗透。当你的模型调用量达到一定量级——ChatGPT全球月活用户数亿，Codex在企业开发者中渗透率飙升，API和Agent产品的推理需求是天文数字——自研芯片就从可选项变成了必选项。Jalapeño计划2026年底开始初始部署，最先服务OpenAI自己的数据中心，第二阶段扩展到微软等合作伙伴。明年用ChatGPT，后台可能已经是Jalapeño在处理你的请求了。

AI芯片竞争维度升级：从堆算力到提效率

Jalapeño的发布释放了一个明确信号：AI硬件竞争正在从堆算力走向提效率。过去比的是单一芯片的峰值算力，谁的TFLOPS更高、跑分更漂亮。现在比的是全栈能力——模型、编译器、芯片、HBM内存、网络和机架系统，任何一个环节掉链子都不行。矩鼎证券研报指出，后续市场对AI硬件公司的定价将更重视三个维度：深度适配实际推理负载的能力、在功耗带宽延迟间实现更优平衡的能力、稳定的产业链协同和量产落地能力。

博通CEO陈福阳透露，Jalapeño只是多代路线图的开端，下一代芯片预计2028年推出，此后每年迭代一次。这个节奏如果跑通，OpenAI将从根本上改变自己的成本结构和算力自主性。当然，从流片到大规模量产还有良率、供应链、软件生态等一系列问题要解决。英伟达的CUDA平台用了十几年才成为AI界的通用语言，想让所有人换套新系统，难度不亚于让全国司机一夜之间改靠左行驶。

但Jalapeño的出世至少证明了一件事：AI不仅能帮人干活，还能帮自己造身体。用最懂LLM的模型，设计最跑LLM的硬件，一旦这个循环跑起来，算力更便宜、AI更普及的未来将会加速到来。2026年的AI行业正在经历一个微妙的转折——上半场拼模型能力，下半场拼基础设施效率，而Jalapeño可能就是下半场的开场哨。 OpenAI Jalapeño自研推理芯片 Jalapeño推理芯片技术优势与路线图