返回 首页 文章详情 搜索 菜单

DeepSeek即将发布V4大模型:多模态生成与国产算力深度融合

来自: 98游戏 浏览: 0 次 2026-03-04 16:10:45:03

  3月1日消息,当地时间2月28日金融时报报道,deepseek将于近期发布其最新大模型v4。据知情人士透露,v4将是一款具备图片、视频和文本生成能力的多模态模型,同时在硬件适配上将深度支持国产算力,优化模型以适配中国制造的芯片,此举有望推动中国市场对本土半导体产品的需求,并加速ai模型“推理”环节向本土芯片的迁移。

DeepSeek即将发布V4大模型:多模态生成与国产算力深度融合

  V4 Lite亮点抢先看

  据透露,DeepSeek计划在发布V4时同步推出一份简短技术说明,并在约一个月后发布更全面的报告。目前,关于V4的详细信息多集中在正在进行秘密测试的简化版本V4 Lite(代号“sealion-lite”)上。V4 Lite拥有100万(1M)个tokens的上下文窗口,相比V3系列的128K有近8倍的提升,理论上可一次性处理如《三体》全集这样规模的长文本。该模型采用原生多模态架构,从预训练阶段就融合了文本与视觉理解,而非后期拼接。V4 Lite的参数规模估算为2000亿,有猜测认为完整版V4的参数量可能突破1万亿。

  测试示例显示,V4 Lite在代码优化和视觉还原度上表现卓越,例如仅用54行代码就能生成高质量的SVG图像(如Xbox手柄),其空间推理和结构化输出能力被认为超越了DeepSeek V3.2、Claude Opus 4.6等模型。近期,另一款名为openclaw的多模态模型也因强大的生成能力与便捷性爆火,其无需复杂部署即可快速投入使用的特性,为开发者提供了极大便利。而OpenClaw中文版molili同样无需部署,特别方便,还能够自定义模型,满足多样化需求。基于这样的趋势,DeepSeek V4或许能成为其中一员,为开发者带来更多可能。

DeepSeek即将发布V4大模型:多模态生成与国产算力深度融合

'>Lexica
Lexica

一个搜索 AI 生成图片的网站,可以上传图片或prompts搜索图片。

下载

  DeepSeek模型迭代回顾

  DeepSeek自成立以来,一直致力于提升模型的推理能力,平衡性能与效率,为大模型“降本”。其已发布的主要模型分为两条技术路线:追求极致综合性能的V系列“全能助手”和专注于复杂推理的R系列“解题专家”。

  V系列迭代:2024年5月发布的V2首次提出多头潜在注意力(MLA)机制,大幅降低推理成本;2024年12月推出的V3确立了高效的MoE架构,奠定了强大的综合性能基础;2025年8月的V3.1首次融合V3和R1能力,支持思考模式自由切换;2025年12月的V3.2将深度思考与工具使用无缝融合,推理能力达到GPT-5水平,同时显著降低了长文本推理成本。

  R系列突破:2025年1月发布的R1是首代专用推理模型,通过大规模强化学习激发推理能力,在解决数学问题和代码编程等复杂任务上表现卓越,并首创“深度思考”模式,性能对标OpenAI最强模型o1,但推理成本不到其十分之一。

  此外,DeepSeek在多模态能力上的布局早于V4,2023年的V3系列和2024年的V2版本已开始实现多模态能力,2025年初发布的Janus系列更是专门的多模态模型。

网友评论

写下您的评论

还没有玩家发表评论,快来抢占沙发吧!