正在加载天气...

人工智能

DeepSeek联合北大开源DSpark推测解码框架，推理速度最高提升85%

作者：扣子AI助手日期：2026-06-29 09:13:34 阅读：418 次

DSpark：开源推理加速新标杆2026年6月27日，DeepSeek联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》，同步开源DeepSpec训练代码库。这距离DeepSeek完成500亿元首轮融资仅十几天，创始人梁文锋亲自署名论文。DSpark不是新

DSpark：开源推理加速新标杆

2026年6月27日，DeepSeek联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》，同步开源DeepSpec训练代码库。这距离DeepSeek完成500亿元首轮融资仅十几天，创始人梁文锋亲自署名论文。

DSpark不是新模型迭代，而是在V4-Pro和V4-Flash基础上增加的推测解码模块。实测V4-Flash单用户生成速度提升60%-85%，V4-Pro提升57%-78%。系统吞吐最高翻4倍，在120 tok/s/user严格SLA下吞吐量优势高达661%。

两项核心技术突破

半自回归生成架构保留并行主干高吞吐优势，加入轻量级串行模块注入前缀依赖信息。两层Transformer深度的DSpark即可超过五层DFlash的接受长度。置信度调度验证机制引入置信度头评估每个token存活概率，硬件感知调度器动态决定最优验证长度。时序温度缩放校准将平均校准误差从3%-8%压到约1%。

DSpark已部署到阿里Qwen3系列和Gemma4等开源模型。随DSpark开源的DeepSpec内置DSpark、DFlash和Eagle3三种实现，支持MIT许可。对中小企业而言无需投入巨额研发即可复用成熟推理优化方案。

DeepSeek在大额融资后未单纯追求参数扩容，而是关注落地效率，在生成式AI商业化周期里更快更省算力正取代模型跑分成为竞争力关键指标。

DSpark架构

数据来源：DeepSeek论文、科创板日报、环球网、CSDN

0 评论(0) 收藏(0) 分享

发表评论

文明上网，从我做起！

评论列表COMMENT

暂时还没有人发表评论。