庄闲和游戏-刚刚DeepSeek搞了个V4预览版震撼行业

更新时间：2026-04-25

点击次数：

　　庄闲和游戏(中国)股份有限公司-官网

庄闲和游戏-刚刚DeepSeek搞了个V4预览版震撼行业

　　就在今天，DeepSeek官宣，全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。

　　根据官方资料显示，DeepSeek-V4 拥有百万字超长上下文，在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。

　　而预览版的出现，不仅把“万亿参数”、“1M上下文”这些令人炫目的技术指标尘埃落地，更预示着一场深刻的“AI革命”正在发生。

　　要知道，DeepSeek-V4将首次实现对华为昇腾、寒武纪、海光信息等国产AI芯片的同步深度适配，这标志着全球首个顶级 MoE 大模型全栈国产落地。

　　而就在今天，DeepSeek-V4昇腾首发也将在B站开播，意味着 DeepSeek V4 将在华为昇腾 AI 处理器上完成适配和部署——国产大模型 + 国产算力的标志性组合，国产替代正加速突围。

　　两相结合来看，DeepSeek这一步，无不在揭开国内AI基础设施自主可控的序幕。

　　DeepSeek-V4作为深度求索最新一代基础模型，最大亮点在于结构创新和超高上下文效率。

　　根据官宣资料显示，DeepSeek-V4开创了一种全新的注意力机制，在 token 维度进行压缩，结合 DSA 稀疏注意力（DeepSeek Sparse Attention），实现了全球领先的长上下文能力，并且相比于传统方法大幅降低了对计算和显存的需求。

　　要知道一年前，1M（一百万）上下文还是Gemini独家的王牌。而现在，DeepSeek直接把1M上下文变成了所有服务的标配。

　　而除了百万上下文普惠化，DeepSeek-V4还对Agent能力进行专项优化，针对 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化，在代码任务、文档生成任务等方面表现均有提升。

　　其中，DeepSeek-V4-Pro性能比肩顶级闭源模型，分别体现在三方面。

　　在 Agentic Coding 评测中，V4-Pro 已达到当前开源模型最佳水平，并在其他 Agent 相关评测中同样表现优异。

　　二是，在世界知识测评中， DeepSeek-V4-Pro 世界知识储备大幅领先全部开源模型，仅略逊于顶尖闭源模型Gemini-Pro-3.1。

　　在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的优异成绩。

　　虽然对比DeepSeek-V4-Pro，DeepSeek-V4-Flash在世界知识储备方面、高难度任务上稍逊一筹，但却分别展现出了接近的推理能力，以及在简单任务上的旗鼓相当。

　　同时，由于模型参数和激活更小，V4-Flash还能够提供更加快捷、经济的API服务。

　　目前，V4-Pro 与 V4-Flash 最大上下文长度为1M，均同时支持非思考模式与思考模式，已开放调用。

　　其中思考模式支持 reasoning_effort参数设置思考强度（high/max），官方建议，对于复杂的 Agent场景使用思考模式，并设置强度为 max。

　　DeepSeek-V4预览版本的发布，标志着大模型进入“高效化、轻量化、场景化”的新阶段，而MoE架构作为实现“大参数、高效率”的核心路径，有望成为未来大模型研发的主流方向。

　　从当前适配情况来看，DeepSeek-V4系列可兼容主流GPU芯片，同时针对国产算力芯片进行了专项优化，为国产芯片的落地提供了重要场景支撑。

　　对于国产算力芯片（如寒武纪思元、壁仞BR100、沐曦MX1等）而言，DeepSeek-V4的轻量化设计（如V4-Flash型号）为其提供了适配场景——相较于传统大模型对芯片算力的极致依赖，V4-Flash的激活参数量仅13B，对芯片显存、算力的要求相对温和，能够让国产芯片在中低端算力场景中实现“性能适配”，加速国产芯片的商业化落地。

　　由此，对于国产算力生态而言，DeepSeek-V4的突破为国产大模型与国产算力芯片、服务器的协同发展提供了重要契机，有望打破海外算力生态的垄断，推动国产算力产业链的自主可控。

　　而除了推动中国AI行业发展外，DeepSeek-V4预览版本的面世，也是DeepSeek现阶段发展的一剂强心针。

　　DeepSeek成立于2023年，由量化资管公司幻方量化的创始人梁文锋创立，一直以开源模型为核心，商业化上没有太多动作，主要靠幻方量化提供资金支持。

　　一方面，在字节阿里等大厂的重投入下，DeepSeek已经掉到了C端用户量第三。

　　第三方数据机构QuestMobile数据显示，截至2026年3月，AI原生App中，字节豆包、阿里千问、DeepSeek排名前三位，月活用户规模分别为3.45亿元、1.66亿元和1.27亿元。

　　据晚点LatePost，2025年下半年至今，DeepSeek至少5名核心研发成员确认离职——第一代大语言模型核心作者王炳宣去了腾讯，V3核心贡献者罗福莉被雷军千万年薪挖至小米，R1核心研究员郭达雅以传闻近亿元总包入职字节跳动Seed团队，OCR系列核心作者魏浩然和多模态成果核心贡献者阮翀也先后离开。5个人，覆盖了基座模型、推理、OCR、多模态四条核心技术主线。

　　而这边，DeepSeek略显失意，另一边，同为大模型独角兽，智谱科技和MiniMax IPO后，市值却在一度冲顶。

　　4月17日，DeepSeek首次被曝出以不低于100亿美元估值寻求融资，计划募集至少3亿美元。

　　仅一周时间，市场热情就被点燃，阿里腾讯均被传出入局竞投的消息。虽然截至目前，以上公司均未公开确认或回应上述投资意向及具体数据。

　　但据《财经》，有接近交易人士称，投资方为腾讯与阿里巴巴，两家投资方预计共计投资18亿美元，本轮融资估值约200亿美元。

　　如果按照这一估值来看，DeepSeek首轮融资便将超过今年3月被披露新一轮融资估值约180亿美元的月之暗面。

　　现如今，DeepSeek-V4预览版虽比原计划晚到了2个月，但却显得恰逢其时。

　　在这个融资节点，先推出预览版，无不在预热DeepSeek的“王者归来”。

　　正如DeepSeek官宣内容的那句，“不诱于誉，不恐于诽，率道而行，端然正己。”

　　出自荀子《非十二子》，意思是：不被赞誉诱惑，不被诽谤吓到，按自己认定的道往前走，端正自己。