2026 年 4 月 24 日,国产 AI 企业深度求索(DeepSeek)正式发布新一代旗舰大模型 DeepSeek‑V4 预览版,同步开源并开放官网、App 及 API 调用服务。本次发布包含V4‑Pro(1.6T 参数)与V4‑Flash(284B 参数)两个版本,全系原生标配 100 万 Token 超长上下文(约合 75 万字),并实现华为昇腾全链路深度适配,标志着国产大模型在长文本能力与算力自主可控领域双双达成里程碑式突破。
一、双版本精准布局,百万上下文普惠化
DeepSeek‑V4 系列聚焦 “长文本、强推理、高性价比”,双版本覆盖不同场景需求,彻底打破超长上下文技术的高门槛壁垒:
DeepSeek‑V4‑Pro(旗舰版):总参数 1.6T(激活 49B),定位高性能场景,在 Agent 智能体、代码生成、数学推理、世界知识等核心评测中超越所有开源模型,交付质量接近顶级闭源模型水平,适配复杂科研、企业级长文档分析、全链路智能体任务等场景。
DeepSeek‑V4‑Flash(轻量版):总参数 284B(激活 13B),主打高性价比,推理性能接近 Pro 版,简单 Agent 任务表现持平,适合中小企业轻量化部署、日常长文本处理、批量 API 调用等场景。
技术层面,V4 系列首创KV Cache 滑窗压缩 + 混合注意力架构,100 万 Token 上下文场景下,单 Token 推理算力消耗仅为 V3.2 的 27%,KV 缓存占用降至 10%,大幅降低长文本处理的成本与延迟,让百万级上下文能力从 “高端专属” 变为 “全民普惠”。
二、全面适配华为昇腾,国产算力闭环成型
本次发布的核心亮点之一,是DeepSeek‑V4 全系实现华为昇腾全链路适配,成为全球首批在国产 AI 芯片上完成推理 + 训练适配的头部开源大模型。
算力适配全覆盖:华为昇腾第一时间宣布,A2、A3、950 全系列超节点全面支持 V4 模型,从芯片、CANN 框架到模型推理、微调训练完成国产化闭环,彻底摆脱对英伟达 CUDA 生态的依赖。
性能表现优异:实测数据显示,昇腾 950 超节点运行 V4‑Pro 时,8K 输入场景下单 Token 推理延迟约 20ms,单卡解码吞吐达 4700TPS;V4‑Flash 延迟低至 10ms,吞吐 1600TPS,推理性能与英伟达高端 GPU 持平,部分场景性价比提升 80%。
训练侧突破:V4‑Flash 版本的后训练流程完全在华为昇腾集群上完成,并开放基于昇腾 A3 集群的微调参考实现,为国产大模型 “训练 + 推理” 全流程国产化提供标杆案例。
三、核心能力全面跃升,多项指标全球领先
除超长上下文与算力适配外,DeepSeek‑V4 在推理、代码、智能体等核心能力上实现全面升级,多项关键指标跻身全球第一梯队:
世界知识:主流知识评测中大幅领先开源模型,仅次于谷歌 Gemini‑3.1‑Pro,百科、常识、专业知识问答准确率达 98.2%。
代码能力:SWE‑Bench Verified 测试得分 83.7,超越 GPT‑5.2 与 Claude Sonnet 4.5,支持 338 种编程语言,可一次性理解数十万行代码,实现全站工程自动化。
数学推理:Codeforces 竞赛评分 3206 分,达到国际顶尖程序员水平,擅长复杂数学证明、公式推导与科学计算。
Agent 智能体:Agentic Coding 评测获开源模型最佳成绩,支持长链路任务规划、工具自主调用、多轮复杂交互,能力接近闭源顶级模型。
四、开源开放 + 亲民定价,加速产业落地
秉承开放理念,DeepSeek‑V4 预览版同步开源权重,开发者可在 Hugging Face、Modelscope 等平台免费获取,支持本地部署、私有化部署与二次微调。
定价策略主打 “普惠”,大幅降低企业使用门槛:
输入:1 元 / 百万 Token;
输出:V4‑Flash 2 元 / 百万 Token,V4‑Pro 24 元 / 百万 Token;
官方明确,待昇腾 950 超节点批量上市后,价格将进一步下调,助力长文档处理、智能体应用等场景规模化落地。
五、行业影响:国产 AI “模芯协同” 闭环成形
业内分析认为,DeepSeek‑V4 的发布具有双重里程碑意义:
技术层面:国产大模型首次实现 “百万上下文 + 强推理 + 国产算力适配” 三重突破,长文本处理能力从 128K 跃升至 1M,完成对海外模型的弯道超车。
产业层面:DeepSeek 与华为昇腾的深度绑定,标志着国产大模型 + 国产算力芯片的技术闭环正式形成,有效规避外部技术限制,为中国 AI 产业自主可控发展提供核心支撑。
受此消息影响,4 月 24 日算力相关板块集体走强,海光信息上涨 9.61%,星华新材上涨 15.67%,市场对国产 AI 产业链的信心持续提升。
目前,DeepSeek‑V4 已在官网、App 及阿里云百炼等平台上线,用户可直接体验百万字长文档处理、全代码库分析、复杂智能体任务等前沿能力。