DeepSeek即将发布V4大模型：多模态生成与国产算力深度融合

来自： 98游戏浏览： 3 次 2026-03-04 16:10:45:03

　　3月1日消息，当地时间2月28日金融时报报道，deepseek将于近期发布其最新大模型v4。据知情人士透露，v4将是一款具备图片、视频和文本生成能力的多模态模型，同时在硬件适配上将深度支持国产算力，优化模型以适配中国制造的芯片，此举有望推动中国市场对本土半导体产品的需求，并加速ai模型“推理”环节向本土芯片的迁移。

　　V4 Lite亮点抢先看

　　据透露，DeepSeek计划在发布V4时同步推出一份简短技术说明，并在约一个月后发布更全面的报告。目前，关于V4的详细信息多集中在正在进行秘密测试的简化版本V4 Lite（代号“sealion-lite”）上。V4 Lite拥有100万（1M）个tokens的上下文窗口，相比V3系列的128K有近8倍的提升，理论上可一次性处理如《三体》全集这样规模的长文本。该模型采用原生多模态架构，从预训练阶段就融合了文本与视觉理解，而非后期拼接。V4 Lite的参数规模估算为2000亿，有猜测认为完整版V4的参数量可能突破1万亿。

　　测试示例显示，V4 Lite在代码优化和视觉还原度上表现卓越，例如仅用54行代码就能生成高质量的SVG图像（如Xbox手柄），其空间推理和结构化输出能力被认为超越了DeepSeek V3.2、Claude Opus 4.6等模型。近期，另一款名为openclaw的多模态模型也因强大的生成能力与便捷性爆火，其无需复杂部署即可快速投入使用的特性，为开发者提供了极大便利。而OpenClaw中文版molili同样无需部署，特别方便，还能够自定义模型，满足多样化需求。基于这样的趋势，DeepSeek V4或许能成为其中一员，为开发者带来更多可能。

DeepSeek即将发布V4大模型：多模态生成与国产算力深度融合

Lexica

一个搜索 AI 生成图片的网站，可以上传图片或prompts搜索图片。

下载

　　DeepSeek模型迭代回顾

　　DeepSeek自成立以来，一直致力于提升模型的推理能力，平衡性能与效率，为大模型“降本”。其已发布的主要模型分为两条技术路线：追求极致综合性能的V系列“全能助手”和专注于复杂推理的R系列“解题专家”。

　　V系列迭代：2024年5月发布的V2首次提出多头潜在注意力（MLA）机制，大幅降低推理成本；2024年12月推出的V3确立了高效的MoE架构，奠定了强大的综合性能基础；2025年8月的V3.1首次融合V3和R1能力，支持思考模式自由切换；2025年12月的V3.2将深度思考与工具使用无缝融合，推理能力达到GPT-5水平，同时显著降低了长文本推理成本。

　　R系列突破：2025年1月发布的R1是首代专用推理模型，通过大规模强化学习激发推理能力，在解决数学问题和代码编程等复杂任务上表现卓越，并首创“深度思考”模式，性能对标OpenAI最强模型o1，但推理成本不到其十分之一。

　　此外，DeepSeek在多模态能力上的布局早于V4，2023年的V3系列和2024年的V2版本已开始实现多模态能力，2025年初发布的Janus系列更是专门的多模态模型。