OpenAI首颗自研芯片Jalapeño流片成功:9个月创纪录,推理成本砍半
OpenAI的第一颗自研芯片,终于从实验室走到了聚光灯下。6月底,Sam Altman从博通CEO陈福阳手中接过一片晶圆的照片刷屏科技圈——那不是PPT,而是一颗已经在实验室跑通真实模型的工程样片。它的代号叫Jalapeño(墨西哥辣椒),是OpenAI从头设计的第一颗AI推理芯片,专治推理太贵、太慢、太耗电的行业痛点。
九个月从零到流片:行业纪录被碾碎
在半导体行业,一颗高性能ASIC从架构设计到流片,常规周期是两到三年。Google第一代TPU花了大约三年,传统芯片公司同等规模项目动辄五到七年。而OpenAI只用了九个月,这被称为高性能先进半导体领域有史以来最快的ASIC开发周期。
怎么做到的?核心是两条腿走路。第一,OpenAI用自家模型加速了芯片设计和优化流程。芯片设计最折磨人的环节不是架构,而是设计完成后成千上万次的验证、修改、再验证的死循环,这部分在项目周期里往往占掉大半时间。AI恰好擅长这种暴力枚举的脏活累活。OpenAI明确提到,他们用自家模型参与了芯片布局、功耗优化、信号完整性验证等环节——一个AI模型在设计下一代能让自己跑得更快的芯片,自我强化的飞轮已经开始转动。
第二,OpenAI拉来了真正的专业团队。硬件团队掌门人Richard Ho曾在Google做了九年TPU芯片工程,最高做到高级工程总监,参与发明的机器学习辅助芯片设计方法让多个TPU项目第一次流片就成功。2023年底加入OpenAI后,他迅速拉起一支约40人的精锐部队。芯片架构由OpenAI自己定义,工程实现和网络连接技术由博通负责,板卡机架和系统集成由Celestica完成,制造端则交给台积电。三家各司其职,OpenAI出脑子,博通出肌肉,Celestica出手脚。
只做推理不碰训练:精准切入成本死穴
Jalapeño有个非常明确的定位:只做推理,不搞训练。训练是教模型读书认字的阶段,需要极其恐怖的算力密度和海量高带宽内存,英伟达GPU凭借CUDA生态筑起了几乎无法逾越的护城河。推理则是模型答题的阶段,模型已经定型,只需在既定框架下快速、低成本地处理海量用户请求,最适合用专用芯片做精准优化。
Jalapeño正是冲着这个死穴来的。博通CEO陈福阳透露,跟市面上主流AI GPU相比,Jalapeño能把推理成本砍掉接近50%。早期测试显示,其每瓦性能大幅优于当前业界最先进水平,陈福阳甚至放话说这颗芯片的表现足以和英伟达Blackwell、Google TPU掰手腕。
更重要的是,Jalapeño不是通用芯片,而是围绕OpenAI实际运行的模型、核心算子、数据搬运、网络通信和调度需求做的软硬件协同优化。通过减少数据搬运,平衡计算、内存和网络资源,把芯片的实际利用率拉到最高。目前工程样品已在目标频率和功耗下成功运行GPT-5.3-Codex-Spark,不是PPT,是真跑起来了。
从买算力到设计算力的战略转身
OpenAI不是第一个自研芯片的AI公司。Google在2015年就部署了首代TPU,AWS先后搞了Inferentia和Trainium,Meta围绕推荐和广告开发MTIA。但注意一个关键区别:Google、AWS、Meta都是云计算或社交巨头,本身就有海量基础设施需求,每年在数据中心上的投入几百亿美金。OpenAI是第一个以纯模型厂商身份下场做芯片的。
这意味着一种趋势正在往下渗透。当你的模型调用量达到一定量级——ChatGPT全球月活用户数亿,Codex在企业开发者中渗透率飙升,API和Agent产品的推理需求是天文数字——自研芯片就从可选项变成了必选项。Jalapeño计划2026年底开始初始部署,最先服务OpenAI自己的数据中心,第二阶段扩展到微软等合作伙伴。明年用ChatGPT,后台可能已经是Jalapeño在处理你的请求了。
AI芯片竞争维度升级:从堆算力到提效率
Jalapeño的发布释放了一个明确信号:AI硬件竞争正在从堆算力走向提效率。过去比的是单一芯片的峰值算力,谁的TFLOPS更高、跑分更漂亮。现在比的是全栈能力——模型、编译器、芯片、HBM内存、网络和机架系统,任何一个环节掉链子都不行。矩鼎证券研报指出,后续市场对AI硬件公司的定价将更重视三个维度:深度适配实际推理负载的能力、在功耗带宽延迟间实现更优平衡的能力、稳定的产业链协同和量产落地能力。
博通CEO陈福阳透露,Jalapeño只是多代路线图的开端,下一代芯片预计2028年推出,此后每年迭代一次。这个节奏如果跑通,OpenAI将从根本上改变自己的成本结构和算力自主性。当然,从流片到大规模量产还有良率、供应链、软件生态等一系列问题要解决。英伟达的CUDA平台用了十几年才成为AI界的通用语言,想让所有人换套新系统,难度不亚于让全国司机一夜之间改靠左行驶。
但Jalapeño的出世至少证明了一件事:AI不仅能帮人干活,还能帮自己造身体。用最懂LLM的模型,设计最跑LLM的硬件,一旦这个循环跑起来,算力更便宜、AI更普及的未来将会加速到来。2026年的AI行业正在经历一个微妙的转折——上半场拼模型能力,下半场拼基础设施效率,而Jalapeño可能就是下半场的开场哨。

评论列表COMMENT
- 暂时还没有人发表评论。
发表评论
文明上网,从我做起!