DeepSeek-V3.2-Exp模型全新发布并开源,引领AI探索之旅-Fin头条

toodd 2周前 (10-07) 阅读数 13 #科技

2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

版权声明

本文仅代表作者观点,不代表本站立场。
如本文侵犯了你的权利,请联系toodd123@163,com删除。

热门
标签列表