泡泡网科技生活频道 PCPOP首页      /      科技生活频道     /      新闻    /    正文

DeepSeek-V4发布 脱离英伟达框架转向华为

  DeepSeek正式宣布推出全新系列模型DeepSeek-V4,包含V4-Pro和V4-Flash两个版本。该系列以百万字的超长上下文能力为亮点,在Agent能力、世界知识及推理性能方面,不仅在国内市场上处于领先地位,也在开源领域中取得了显著成绩。用户可以通过更新API服务中的model_name为deepseek-v4-pro或deepseek-v4-flash来调用新的功能。

  V4-Pro在多项评测中表现卓越,特别是在Agent能力、世界知识和数学推理等方面达到了开源模型的最佳水平,其推理性能与顶尖闭源模型相媲美。而V4-Flash则通过更小的参数量,提供更快速且经济的API服务,适合轻量级应用场景。这一设计延续了DeepSeek一直以来的效率优先哲学,尽管总参数量高达1万亿,但每个token仅需激活约370亿参数,保持了与前代V3相当的推理成本。


  为了实现这一重大进步,DeepSeek V4将运行在华为最新的昇腾芯片上。工程师们为此投入大量精力,解决了芯片适配问题,不仅重写了核心代码,还完成了从英伟达CUDA生态向华为CANN架构的底层迁移。这一技术决策不仅标志着DeepSeek在硬件适应性上的重大突破,也传递出强烈的战略信号,表明其独家开放了早期访问权限给国产芯片厂商,而没有为英伟达或AMD提供提前优化的机会。

  此外,V4针对多款主流Agent产品进行了专项适配优化,旧版API接口模型名deepseek-chat和deepseek-reasoner将于2026年7月24日正式停用,用户需要提前切换至新模型名称。DeepSeek表示,百万级的超长上下文能力将成为旗下所有官方服务的标准配置,未来将继续致力于推动AI技术的发展与应用。

        在官方发布的文章最后,DeepSeek还引用荀子名句自勉:不诱于誉,不恐于诽,率道而行,端然正己.

0人已赞

关注我们

泡泡网

手机扫码关注