DeepSeek联合北大开源DSpark推理加速框架:生成速度提升60%-85%,GitHub一日获900+ Star
DeepSeek联合北大开源DSpark推理加速框架:生成速度提升60%-85%,GitHub一日获900+ Star
6月27日下午,DeepSeek联合北京大学正式开源DSpark推理加速框架及DeepSpec全栈推测解码工具链,DeepSeek创始人梁文锋署名论文同步发布。这是DeepSeek完成500亿元融资后的首次开源动作,标志着其战略布局从模型训练向推理优化延伸。
技术突破:半自回归生成+置信度调度
DSpark的核心创新在于提出了一种基于半自回归生成的置信度调度推测解码方案。传统推测解码方法存在两大痛点:一是草稿模型生成质量不稳定,二是高并发场景下吞吐率大幅滑坡。DSpark通过并行骨干网和轻量级顺序头生成草稿标记,并引入硬件感知前缀调度器(Hardware-Aware Prefix Scheduler),根据置信度分数动态保留高置信度前缀、丢弃低置信度标记,从而在保证生成质量的同时大幅提升推理速度。
论文数据显示,部署于DeepSeek-V4线上生产环境后,单用户生成速度提升60%至85%,同时避免了吞吐率大幅滑坡。在部分场景下,吞吐量提升幅度可达400%。
DeepSpec:全栈开源工具链
随DSpark一同开源的DeepSpec是一套完整的全栈推测解码工具链,包含数据准备工具、草稿模型实现、训练代码和评估脚本。DeepSpec采用MIT协议,支持开发者基于Qwen3、Gemma等主流开源模型训练自己的推测解码草稿模型。这意味着开发者无需从零开始,即可在自己的应用场景中复现DSpark的推理加速效果。
GitHub上线一天即获900+ Star,开发者社区反响热烈。多位AI开发者表示,DSpark的开源将显著降低大模型推理成本,尤其对需要高并发响应的应用场景(如智能客服、实时翻译、代码辅助等)具有直接价值。
战略意义:从训练到推理的布局延伸
DeepSeek于2026年初完成500亿元融资,此次开源DSpark是其融资后的首个重大技术动作。选择推理优化而非模型训练作为开源方向,体现了DeepSeek对AI落地瓶颈的精准判断——随着模型能力不断攀升,推理成本已成为制约大规模部署的核心障碍。
业内分析认为,DSpark的开源策略与DeepSeek一贯的"开源生态+商业服务"双轮驱动模式一脉相承。通过开源推理加速框架吸引开发者生态,再通过企业级服务实现商业变现,这一路径已在全球开源社区获得验证。
后续关注
DSpark框架在开发者社区的实际落地进展、能否被主流推理框架(如vLLM、TGI等)集成、以及DeepSeek下一阶段的开源方向,将是业内持续关注的焦点。
评论列表COMMENT
- 暂时还没有人发表评论。
发表评论
文明上网,从我做起!