并行科技

北京并行科技股份有限公司

推荐新闻

MiniMax M3 上线并行科技MaaS平台:一个模型,全能进化!

202661日,国内首个集齐 1M 超长上下文、原生多模态与顶级 Coding/Agent 三大能力的模型——MiniMax M3 正式发布!这不仅是一款性能比肩国际顶尖的全能选手,更是目前同级别中唯一的开源模型。

并行科技 MaaS 平台已第一时间完成 M3 接入,以海量算力破除门槛,让顶尖大模型开箱即用。告别算力焦虑,一键开启您的普惠智算之旅!⬇️

https://www.paratera.com/mass.html

 M3  MiniMax  Agentic Engineering 场景打造的新一代模型能力升级,能够更好地完成复杂任务拆解、代码生成、工程协作、文档理解和多模态信息处理。

01


 

架构革新:MSA稀疏注意力


 

MiniMax M3采用了全新的 MiniMax Sparse Attention (MSA) 架构。不同于传统的全注意力机制(计算复杂度随长度平方级增长),MSA 通过更精确的 KV 分块,配合算子层优化,实现了极高的计算效率。

性能收益:

成本降低 100 万上下文下,每 token 计算量仅为上代模型的 1/20

速度飞跃Prefilling 阶段加速 倍,Decoding 阶段加速 15 倍。

硬件友好比开源的 Flash-Sparse-Attention 快 倍以上,真正实现了长上下文的普惠。

02


 

能力越级:比肩国际顶尖模型


 

在多项国际权威评测中,M3 展现出了比肩甚至超越海外闭源模型的实力:

03


 

实战表现:从“写代码”到“做科研”


 

M3 不仅在 Benchmark 上跑分高,更在复杂的真实任务中表现出色:

独立复现顶会论文M3 成功独立复现了 ICLR 2025 Outstanding Paper Award 获奖论文,自主运行 12 小时,产出 18 次 commit 与 23 张实验图表,并跑通核心实验。

自主优化 CUDA 算子:在没有参考代码的情况下,M3 自主优化了 NVIDIA Hopper 架构的 FP8 GEMM kernel,将硬件峰值利用率从 7.6% 提升至 71.3%(实现相较于原始版本的 9.4× 加速)。 

自我迭代训练: PostTrainBench 任务中,M3 自主完成了数据合成、训练、评测的全流程,最终得分(0.37)略低于 Opus 4.70.42)和 GPT-5.50.39),但明显领先其他模型。

 


 


 

如何体验M3?



 

MiniMax M3现已上线并行科技MaaS平台,把模型能力从更强推进到更能干活。并行科技提供灵活的按需调用与本地私有化部署,以海量GPU资源免去前期投入,实现极致性价比;7×24小时专业技术服务团队全程护航,让应用落地无后顾之忧。

 

立即登录并行科技MaaS平台,一起探索 M3 在 CodingAgent、办公、多模态和复杂任务场景中的更多可能!

 
 
MiniMax M3评测