首页 > 快讯 > 揭秘 DeepSeek 的“MODEL1”新架构:预见编程能力攀升,2月迎重大突破
揭秘 DeepSeek 的“MODEL1”新架构:预见编程能力攀升,2月迎重大突破
发布时间:2026-01-21 12:11:57 | 责任编辑:吴昊 | 浏览量:64 次
据 小编 报道,正值 DeepSeek-R1发布一周年之际,DeepSeek 下一代旗舰模型的线索已悄然浮出水面。结合 The Information 的爆料,这款备受期待的新模型(或为 DeepSeek V4)最快有望于今年2月中旬(农历新年期间)正式登场,并预计带来更强悍的代码生成能力。
开发者在 DeepSeek 的 GitHub 仓库中发现,其更新的 FlashMLA 代码库中,横跨114个文件有多达28处引用了名为 “MODEL1” 的神秘标识符。代码逻辑显示,“MODEL1” 是一个区别于现有 “V32”(DeepSeek-V3.2)的全新架构。二者的关键差异体现在键值(KV)缓存布局、稀疏性处理方式以及 FP8数据格式的解码支持上,这表明新模型在内存优化和计算效率方面进行了针对性的底层重构。
此前,DeepSeek 团队已陆续发布了关于“优化残差连接(mHC)”和受生物学启发的“AI 记忆模块(Engram)”等技术论文。业界普遍猜测,这些最新的研究成果极有可能被整合进正在开发的“MODEL1”中,为这款即将发布的新旗舰提供核心技术支撑。
©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
