MiniMax-M1 混合架构推理模型

授权协议:None操作系统:None 开发语言:None
MiniMax-M1 是开放权重的大规模混合注意力推理模型,该模型基于 MiniMax-Text-01 模型开发,采用了混合专家模型(MoE)架构并结合了闪电注意力机制。 M1 的总参数量高达 ...