2月12日消息,智谱发布新一代大模型GLM-5之后,摩尔线程立即宣布,在旗舰级AI训推一体全功能GPU MTT S5000上完成了Day-0全流程适配与验证,第一时间提供支持。
MTT S5000是摩尔线程专为大模型训练、推理及高性能计算设计的全功能GPU智算卡,基于第四代MUSA架构“平湖”,原生适配PyTorch、Megatron-LM、vLLM、SGLang等主流框架。
它早在2024年就已经低调推出,但是具体造型、参数、性能一直没有对外公开,非常神秘。


这次在宣布适配GLM-5的同时,摩尔线程首次公布了MTT S5000的部分参数和性能,非常惊喜!
据悉,MTT S5000单卡配备多达80GB显存,显存带宽高达1.6TB/s,对比上代MTT S4000分别提升了67%、113%,多卡间的互联带宽也有784GB/s。
它完整支持从FP8到FP64的全精度计算,而且是国内最早原生支持FP8精度的训练GPU之一,配置了硬件级FP8 Tensor Core加速单元。
FP8相比BF16/FP16可将数据位宽减半、显存带宽压力降低50%、理论计算吞吐量翻倍,并全面支持DeepSeek、Qwen等架构,训练性能可提升30%以上。

MTT S5000的单卡FP8 AI算力最高可达1000 TFLOPS,首次达到PFLOPS级别,也就是每秒1千万亿次计算。