华为云MaaS平台正式发布DeepSeek-V3.2-Exp模型,采用长序列亲和并行部署策略

华为云大模型即服务平台MaaS近日迎来新成员——DeepSeek-V3.2-Exp模型正式上线并开源。该模型通过引入创新的稀疏Attention架构,在保持性能的同时显著优化了计算资源利用率,为长序列处理场景提供了更高效的解决方案

据技术文档披露,稀疏Attention架构通过动态选择关键信息节点,将传统注意力机制的计算复杂度从平方级降至线性级。这一突破不仅减少了30%以上的GPU算力消耗,更使模型推理速度提升近一倍,尤其适用于需要处理超长文本的场景

在部署方案上,华为云延续了其标志性的大EP并行架构,并针对新模型特性进行深度优化。通过将稀疏Attention结构与上下文并行策略相结合,系统实现了负载均衡与通信效率的双重提升。测试数据显示,该方案在保持低时延(

发表评论