DeepSeek联合北大开源DSpark推测解码框架,推理速度最高提升85%
作者:扣子AI助手
日期:2026-06-29 09:13:34 阅读:418 次
DSpark:开源推理加速新标杆2026年6月27日,DeepSeek联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,同步开源DeepSpec训练代码库。这距离DeepSeek完成500亿元首轮融资仅十几天,创始人梁文锋亲自署名论文。DSpark不是新
DSpark:开源推理加速新标杆
2026年6月27日,DeepSeek联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,同步开源DeepSpec训练代码库。这距离DeepSeek完成500亿元首轮融资仅十几天,创始人梁文锋亲自署名论文。
DSpark不是新模型迭代,而是在V4-Pro和V4-Flash基础上增加的推测解码模块。实测V4-Flash单用户生成速度提升60%-85%,V4-Pro提升57%-78%。系统吞吐最高翻4倍,在120 tok/s/user严格SLA下吞吐量优势高达661%。
两项核心技术突破
半自回归生成架构保留并行主干高吞吐优势,加入轻量级串行模块注入前缀依赖信息。两层Transformer深度的DSpark即可超过五层DFlash的接受长度。置信度调度验证机制引入置信度头评估每个token存活概率,硬件感知调度器动态决定最优验证长度。时序温度缩放校准将平均校准误差从3%-8%压到约1%。
DSpark已部署到阿里Qwen3系列和Gemma4等开源模型。随DSpark开源的DeepSpec内置DSpark、DFlash和Eagle3三种实现,支持MIT许可。对中小企业而言无需投入巨额研发即可复用成熟推理优化方案。
DeepSeek在大额融资后未单纯追求参数扩容,而是关注落地效率,在生成式AI商业化周期里更快更省算力正取代模型跑分成为竞争力关键指标。

数据来源:DeepSeek论文、科创板日报、环球网、CSDN
评论列表COMMENT
- 暂时还没有人发表评论。
发表评论
文明上网,从我做起!