OpenAI联手博通推出首款自研芯片Jalapeño:九个月量产背后的AI芯片战局
6月24日,美国AI大模型公司OpenAI联手半导体设计和开发公司博通(Broadcom),推出了首款定制AI推理芯片Jalapeño,跨界造芯。这是继谷歌、亚马逊、微软之后,又一家AI巨头正式入局芯片自研赛道,标志着AI产业竞争正从模型层面向算力基础设施层面纵深演进。
九个月:从零到量产的芯片速度纪录
从架构设计到制造流片,OpenAI仅用时9个月,创下了高性能半导体领域迄今最快的ASIC芯片开发纪录。这一速度的背后,是OpenAI将自家模型用于辅助芯片设计——AI帮助设计AI芯片,标志着芯片设计进入“人机协作”的新范式。
OpenAI总裁Greg Brockman对此的解读是:“世界正迈向算力驱动的经济。”在他看来,AI大模型的竞争,本质上是算力的竞争;而算力的竞争,正在向上游的芯片设计延伸。
Jalapeño:专为LLM推理而生
Jalapeño兼容所有大语言模型,成功运行包括GPT-5.3-Codex-Spark在内的机器学习工作负载。与通用GPU追求极致算力不同,Jalapeño在架构层面进行了针对性优化。
OpenAI 硬件项目负责人Richard Ho表示,Jalapeño从底层架构开始就专为LLM推理而设计,围绕内核、内存移动、网络和服务模式等对前沿AI模型至关重要的方面优化了架构。这种“专用化”的设计思路,使得Jalapeño在特定任务上的效率远超通用芯片。
早期测试显示,Jalapeño“每瓦性能大幅优于当前的最先进水平”。虽然OpenAI尚未公开任何具体的性能基准数据,但“每瓦性能”这一指标的提出,本身就揭示了AI芯片竞争的新焦点——不再单纯追求绝对算力,而是追求算力效率。
“去英伟达化”:科技巨头的集体选择
Jalapeño的发布,只是AI巨头“去英伟达化”浪潮中的一朵浪花。在OpenAI之前,谷歌自研TPU始于2015年,亚马逊2018年推出推理芯片Inferentia、2022年推出训练芯片Trainium,微软自研的AI芯片Maia于2023年年底亮相。如今,这份名单还在继续拓展。
博通成为这场变革的最大赢家。它同时为谷歌、Meta等提供定制芯片设计服务,在OpenAI自研芯片的背后,博通也提供了芯片实现和网络连接,帮助将产品推向规模量产。2026财年第一季度,博通AI半导体收入达84亿美元,同比增长106%。
博通CEO Hock Tan坦言,增长“得益于对定制AI加速器和AI网络的强劲需求”。双方已制定多代芯片路线图,计划2028年推出下一代产品,此后每年迭代。这意味着AI芯片定制化将成为长期趋势。
推理算力:下一个主战场
AI芯片竞争正在从“训练”向“推理”转移。2025年,维持ChatGPT服务器响应的成本已高达84亿美元,随着ChatGPT周活跃用户超过9亿,再加上AI从单次问答的聊天工具进化为持续运行的智能体,对推理算力的需求急剧放大,预计2026年相关成本将攀升至140亿美元。
在这一背景下,OpenAI开始思考:能否为这类工作负载打造一款专门的芯片?答案是Jalapeño,它专为LLM推理而设计,不追求通用性。通过减少数据搬运、平衡计算、内存和网络资源,使实际利用率更接近理论峰值。
Jalapeño计划在2026年年底部署到微软及其他合作伙伴的数据中心,博通CEO Hock Tan称之为“吉瓦级数据中心部署的开始”。这意味着,从模型向芯片的一跃,OpenAI开始追求全栈优势。
高通:从端侧走向云端
同样在芯片领域发起攻势的,还有高通。这家在移动芯片领域积累了深厚优势的巨头,开始从端侧走向云端,试图在数据中心市场分一杯羹。
高通CEO克里斯蒂亚诺·阿蒙的判断与OpenAI相似:“代理式AI正推动数据中心对AI推理的需求大幅增长。随着这些工作负载成为主流,基础设施必须在更低的功耗和成本下提供更高的性能。”
6月25日,高通宣布了一套面向数据中心AI基础设施的完整路线图。核心产品包括Dragonfly C1000 CPU,基于Oryon核心的多芯粒架构,集成了超过250个核心,运行频率在5GHz以上,据称每瓦性能比现有竞品的基准高出两倍以上。
更值得关注的是高通发布的HBC(高带宽计算)技术,在同等功耗下带宽是HBM的6倍。而英伟达GPU虽以绝对性能称霸,功耗与成本恰恰是其“阿喀琉斯之踵”。
软件生态:芯片竞争的另一维度
在硬件之外,软件生态的争夺同样激烈。为补齐软件短板,高通于6月24日宣布以约39亿美元收购AI软件公司Modular,以获得一套可跨芯片运行AI模型的软件技术,而无需为每种处理器单独编写代码。
Modular由Chris Lattner(LLVM/Swift之父)创立,核心产品包括高性能AI推理引擎及专为AI内核设计的Mojo编程语言,可将PyTorch/TensorFlow模型无缝编译至CPU/NPU/GPU异构端侧设备。这笔收购有望为高通补齐可对标英伟达CUDA的开放性软件栈。
竞争格局:远未固化
从OpenAI九个月完成芯片设计可以看出,AI芯片的进入门槛正在降低。芯片设计自动化的趋势,意味着更多玩家可以参与到芯片竞争中来。AI行业的竞争格局,远未固化。
与此同时,国内AI芯片企业也在快速追赶。中昊芯英的“须臾”芯片、华为昇腾系列、寒武纪AI芯片等,构成了国产AI芯片的第一梯队。随着国产替代进程的加速,国内AI产业在算力层面的自主可控能力有望持续提升。
可以预见的是,在未来的AI竞争中,谁掌握了芯片定义权,谁就掌握了产业链的话语权。这场从模型到芯片的延伸竞争,才刚刚开始。
评论列表COMMENT
- 暂时还没有人发表评论。
发表评论
文明上网,从我做起!