返回 首页 文章详情 搜索 菜单

DeepSeek V4或将于农历新年推出,代码更新揭示未知大模型“MODEL1”

来自: 98游戏 浏览: 0 次 2026-02-02 19:38:42:02

1月21日最新消息,据科技媒体the information月初披露,ai领军企业deepseek拟于2026年2月中旬、即农历新年假期期间正式推出其全新一代旗舰大模型——deepseek v4。该模型预计将显著强化编程相关能力,尤其在代码生成与理解方面实现跃升。

值得关注的是,在1月20日——恰逢DeepSeek-R1模型发布一周年之际,有开发者于GitHub平台发现,DeepSeek悄然更新了多组FlashMLA核心代码。此次更新覆盖114个文件,在共计28处代码段中均出现了此前从未公开的模型标识符“MODEL1”。尤为关键的是,该标识符并非作为V3.2(即DeepSeek-V3.2)的子版本或变体出现,而是与其并列、独立存在,暗示其属于一套全新序列。

DeepSeek V4或将于农历新年推出,代码更新揭示未知大模型“MODEL1”

进一步结合上下文分析可见,“MODEL1”在底层架构层面与“V32”存在本质性差异:包括键值(KV)缓存的内存排布策略、稀疏注意力机制的实现路径,以及对FP8低精度数据格式的原生解码支持等关键模块均被重构。这些改动指向一个高度定制化的新型架构,极可能聚焦于极致内存压缩与高吞吐推理效率。

与此同时,DeepSeek研究院近期连续公开两篇前沿技术论文:一篇提出“优化残差连接(mHC)”训练范式,另一篇则首次披露受神经科学启发的“AI记忆模块(Engram)”。业界普遍认为,上述创新成果或将深度融入正在研发中的新模型体系,为V4乃至后续迭代提供理论与工程双重支撑。

以上就是98游戏小编为大家带来的全部内容,想了解更多精彩请持续关注本站。

网友评论

写下您的评论

还没有玩家发表评论,快来抢占沙发吧!